Gene Franean1_5337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5337
Symbol
ID	5673671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6433394
End bp	6434551
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	69%
IMG OID	641244195
Product	TIR protein
Protein accession	YP_001509601
Protein GI	158317093
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.135441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAACG GGGGCAACAC GGACAGCAGC ACCACCAGCG GCGACGGCGA CGGCTGGGAC 
TTCTTCGTCT CCTACACTCA GCCCGACCGG GCATGGGCGG AGTGGATTGC CTGGACCCTG 
GAGGAAGCCG GCTGGCGGGT GCTGATCCAG GCGTGGGACT TCACCCCAGG GTCGAACTGG 
GTCACCGGCA TGGACGAAGG CGTCGCCGCC GCGGCGCGGA CGATCGCCGT GCTCTCCCAC 
GCCTACACCC ACTCGGTCTA CGGCGCCGCC GAATGGCGCG CCGCCTGGGC GGCCGATCCG 
ACCGGGGGAC AACGCAAGCT CCTGCCCGTA CGGATCGGTG ACTGCCCCCG ACCGGGCCTG 
CTCGGCCAGA TCGGCTCCGT AGACCTCTTC GGCCTGCCGC AGGACCGGGC ACGCACAACG 
CTGCTGGACG CGGCACAGCG TGTGGTCTCC GGCGGACGAG CAAAACCAGA CACGGCTCCG 
CTGTTCCCCC CGGCCGGACG GGCAGTGCCC ACGCGGCCGT CGTTCCCCGG TAGCCGGCCA 
GATGTCTGGA ATCTCCCGCC GCGGCTGGCC CACTTCGTCG GGCGCACCAC CCTCATCGAC 
CAGATCGAAC ACGAGCTAGC CCGCGCGGGA TCGGTCGCGG TCTGTGCCCT GCACGGCCTC 
GGCGGGATCG GAAAGACCGC CCTCGCCCTC GAATACGCCC ACCGGCATAC GACCGGCTTC 
AACCTGGCCT GGTGGATACC CGCCGAAGAT CCACGGCTCA TCCCCGGACA CGTCTCCGCC 
CTCGGCGTCG AACTCGGCCT ACCCGACGGC GCGGACTGGC ATGACGTACT TGGTGTGCTG 
CGGCGCAAGC AACTGCGCTG GCTCCTCATC CTCGACAACA TCGAAGACCG GACTGTGATC 
GGCCCGTTCC GGCCAACAGA TCACCTCGGC CGGCTGCTCG TCACCACACA GCGCGCCGGA 
CTCGACGGCT ACGGCACTCA AATCGCCGTA CCCGAACTCC CCCGGCATGA CGCGGTGGAC 
CTGCTCACCC GTCGGATACC GAGCATCGAA GTGGGGACGG CCGGACAGAT CACCGATCTC 
CTCGGGAACC TGCCCCTCGC GGTGGAACAA GCCGCCAGCG CCCCGTTACA TCCGCGCTGG 
CACCGTCCAG CCCGCTGA

Protein sequence

MNNGGNTDSS TTSGDGDGWD FFVSYTQPDR AWAEWIAWTL EEAGWRVLIQ AWDFTPGSNW 
VTGMDEGVAA AARTIAVLSH AYTHSVYGAA EWRAAWAADP TGGQRKLLPV RIGDCPRPGL 
LGQIGSVDLF GLPQDRARTT LLDAAQRVVS GGRAKPDTAP LFPPAGRAVP TRPSFPGSRP 
DVWNLPPRLA HFVGRTTLID QIEHELARAG SVAVCALHGL GGIGKTALAL EYAHRHTTGF 
NLAWWIPAED PRLIPGHVSA LGVELGLPDG ADWHDVLGVL RRKQLRWLLI LDNIEDRTVI 
GPFRPTDHLG RLLVTTQRAG LDGYGTQIAV PELPRHDAVD LLTRRIPSIE VGTAGQITDL 
LGNLPLAVEQ AASAPLHPRW HRPAR