Gene Tery_3171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3171
Symbol
ID	4243842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	4839782
End bp	4841212
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	38%
IMG OID	638108180
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_722772
Protein GI	113476711
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.138028
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAAG AATTTGATTA CGACTTAATA ATTATTGGTG CAGGTGTCGG TGGACATGGT 
GCAGCATTAC ACGCTACCAG TTGTGGCCTA AAAACAGCTA TTGTAGAAGT AGCAGAAATG 
GGAGGTACTT GTGTTAACCG AGGTTGTATA CCATCTAAGG CACTTCTCGC AGCATCAGGT 
AAAGTTCGAG AGTTACGAAA TGCTCACCAC TTAAAAACTT TGGGAATTGA GTTGGATAAT 
GTTTCTTATG ACAGACAAGT AATGGCCACT CATGCAAGTA ACATTGTGAC CAAAATTAGA 
GGTGACATGA GCAAAAGCCT TAAACGTCTG AGTGTAGATA TTATTACAGG GTGGGCTCAG 
GTAGCAGGAA AACAAAAAGT TACGGTTAAG ACGGAAAAGG GAGAAGAAAA CTTTACTGCC 
AAAGATATTA TACTTGCTCC TGGTTCAGTA CCTTTTGTTC CTCCTGGAAT AGAATTGGAT 
GGTAAAACAG TATTTACCAG TGATGATGCT CTTAAACTAG ACTGGTTACC ACCTTGGGTT 
GCAATTATTG GTAGTGGTTA TATAGGACTA GAATTTTCTG ATATTTACAC TGCCCTTGGA 
TCTGAAATTA CGATGATTGA GGCATTAGAT AAGTTAATGC CTACTTTCGA TCCAGATATA 
GCTAAGATTG CACAAAGAGT TCTAATTCAG TCAAGAGATA TTGAAGTAAA AGTAGGGAAG 
TTGGCTATAA AGGTAGTTCC TGGATCTCCG GTAATTATTG AACTTGCCGA TGCCAAGACT 
AAAGAAGTAG AAGAAATTAT AGAGGTTGAT GCTTGTCTAG TTGCCACAGG TCGCATTCCC 
TATACAAAAG ATTTAGGACT AGATTCTGTA GCAGTAGAAA CTGATAAATA TGGATTTATT 
CCAGTAAATA GCAAAATGGC AGTTTTGTCA AGTGGTGAAC CAGTACCTAA TTTATGGGCA 
ATTGGTGATG CAACAGGAAA AATGATGTTG GCTCATGCAG CATCTGCCCA AGGAATAACA 
GTGGTAGAAA ATATATGTGG TCGTGATCGA GAACCAGATT ATCTTAGTAT TCCGGCGGCA 
GCTTTTACTC ATCCAGAAAT TAGCTATGTT GGTATGACAG AACCAGCAGC AAAAGATTTA 
GGCCAAAAAC AGGGGTTTGA AGTGGCAAGT GTCAGAACTT ATTTTAAGGG TAATTCTAAG 
GCGATAGCTG AAGATGAAAC AGATGGTATT GCTAAAGTAA TTTATCGTCA AGATACAGGA 
GAATTATTAG GAGTACATAT TATTGGTCTT CATGCCTCTG ACTTAATTCA AGAAGCAGCA 
AATGCTATAG CTAAAAAACA ATCTGTTAAT GAGTTATCTT TTAATGTACA TACTCATCCT 
ACTTTATCAG AAGTTTTGGA TGAAGCATTT AAACGAGCCA CTGTTCACTA G

Protein sequence

MTQEFDYDLI IIGAGVGGHG AALHATSCGL KTAIVEVAEM GGTCVNRGCI PSKALLAASG 
KVRELRNAHH LKTLGIELDN VSYDRQVMAT HASNIVTKIR GDMSKSLKRL SVDIITGWAQ 
VAGKQKVTVK TEKGEENFTA KDIILAPGSV PFVPPGIELD GKTVFTSDDA LKLDWLPPWV 
AIIGSGYIGL EFSDIYTALG SEITMIEALD KLMPTFDPDI AKIAQRVLIQ SRDIEVKVGK 
LAIKVVPGSP VIIELADAKT KEVEEIIEVD ACLVATGRIP YTKDLGLDSV AVETDKYGFI 
PVNSKMAVLS SGEPVPNLWA IGDATGKMML AHAASAQGIT VVENICGRDR EPDYLSIPAA 
AFTHPEISYV GMTEPAAKDL GQKQGFEVAS VRTYFKGNSK AIAEDETDGI AKVIYRQDTG 
ELLGVHIIGL HASDLIQEAA NAIAKKQSVN ELSFNVHTHP TLSEVLDEAF KRATVH