Gene Tery_3369 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3369
Symbol
ID	4243464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5165518
End bp	5166480
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	41%
IMG OID	638108354
Product	NADH ubiquinone oxidoreductase, 20 kDa subunit
Protein accession	YP_722944
Protein GI	113476883
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.626473
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAATC TACTGTGGCT TCAAGGTGGA GCTTGTTCTG GCAATACCAT ATCATTTCTC 
AATGCTGAAG AACCAAATAT TTGTGATTTA ATTACAGACT TCGGCATTAA TGTACTTTGG 
CATCCTTCCC TAGGAATAGA ACTTGGTACA AATGTTCAAC AATTATTAAA AGATTGTATT 
TCCGGAAAAA TACAATTAGA TATTTTAGTA TACGAAGGAA CAGTAATTAA CGCACCAAAT 
GGTATGGGAG ATTGGAACCG TTTTGCCGAT CGGCCAATGA AAAACTGGGT AAAAGAATTA 
GCAGAAATTG CCAGTTTCGT TGTTGCGGTA GGAGACTGCG CTACTTATGG CGGTATTCCG 
GCAATGGCAC CAAACCCCAG TGAGTCTGAA GGTTTACAAT TTCTGAGACG GAAAAAAGGT 
GGATTTTTAG GAGAAGACTT CAAAAGCCAA GCTGGATATC CTGTGATCAA CATTCCTGGT 
TGCCCTGCAC ACCCAGATTG GATTTCGCAA ATATTGGTAG CAGTAGCCAC TGGCAGACTT 
AATGACATTA CCTTAGACGA ATTTCACCGC CCTGAAACAT TTTTCAAAAG CTTCACTCAA 
ACAGGTTGTA CTCGCAACGT TCACTTTGCT TACAAAGCTT CAACCTCAGA TTTTGGGCAA 
CGTCAAGGAT GTCTATTTTA TGATTTAGGT TGTCGCGGAC CGATGACTCG TTCTTCCTGT 
AACCGCATTT TGTGGAACCG AGTTTCTTCT AAAACTCGAG CGGGGATGCC ATGTTTAGGT 
TGCACGGAAC CAGAATTTCC ATTCCAGGAT CTTATGCCTG GAACAGTATT TACAACTCAA 
ACAGTTATGG GAGTGCCTAA AGAATTACCA ACAGGAGTTA ACCGTAAAGA TTATGCTGTA 
TTGACTATGG TTGCTAAAAA TTCAACGCCA GCATGGGCAG AGGAAGATTT CTTTACAGTT 
TAA

Protein sequence

MINLLWLQGG ACSGNTISFL NAEEPNICDL ITDFGINVLW HPSLGIELGT NVQQLLKDCI 
SGKIQLDILV YEGTVINAPN GMGDWNRFAD RPMKNWVKEL AEIASFVVAV GDCATYGGIP 
AMAPNPSESE GLQFLRRKKG GFLGEDFKSQ AGYPVINIPG CPAHPDWISQ ILVAVATGRL 
NDITLDEFHR PETFFKSFTQ TGCTRNVHFA YKASTSDFGQ RQGCLFYDLG CRGPMTRSSC 
NRILWNRVSS KTRAGMPCLG CTEPEFPFQD LMPGTVFTTQ TVMGVPKELP TGVNRKDYAV 
LTMVAKNSTP AWAEEDFFTV