Gene Tery_0398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0398
Symbol
ID	4241962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	620588
End bp	621844
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	37%
IMG OID	638105723
Product	UDP-sulfoquinovose synthase
Protein accession	YP_720337
Protein GI	113474276
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTCC TAGTAATTGG TGGCGATGGC TACTGCGGTT GGGCAACCGC TCTTTATCTT 
TCCAATCAAG GTTATGAGGT AGGTATTTTA GACAGTATGG TTAGGCGACA CTGGGATCTA 
CAACTTCAAG TAGAAACCCT CACACCTATT GCCCCTATTC AACAACGCAT CCAACGTTGG 
AAAGACCTCA CAGGCAAAAA AATTGATCTA TATATAGGAG ATATTACCAA CTACGATTTC 
CTAAGTACAA CACTACATCA GTTTGAACCA GAATCTATAG TTCACTTTGG TGAACAACGT 
TCTGCTCCAT TTTCTATGAT TGACCGGGAA CATGCTGTTA CGACTCAAGT TAATAATGTT 
GTTGGTACTC TCAATATTCT TTATGCTATG AAAGAGGATT TTCCAGACTG CCATTTAGTT 
AAACTGGGAA CTATGGGAGA GTATGGTACT CCTAATATAG ATATTGAAGA GGGTTATATC 
AAAATTGAAC ATAATGGACG CACGGATACT CTACCCTATC CAAAACAACC AGGGTCTTTC 
TATCATCTCA GTAAAGTTCA CGATAGCCAC AACATTCACT TTGCCTGCAA AATATGGGGT 
ATCCGGGCTA CGGACCTTAA TCAAGGAATT GTATATGGTG TTGCTCTAAC TGGTCTTCTA 
AATGATGAAA CAATCCAAGA TGAACTTTTG ATTAACCGTC TTGACTATGA TGGAGTTTTT 
GGTACAGCTC TCAATAGATT TTGTATTCAA GCAGCAATTG GCCATCCGCT AACTGTTTAT 
GGTACAGGTG GACAAACTCG TGGCTTTTTA GATATTAGAG ATACTGTCCG TTGTATGGAA 
ATAGCGATCG CAAACCCAGC ACAACCAGGT GAATTCCGAG TATTTAACCA ATTTACTGAA 
ATGTTTAGTG TACTAGACCT AGCAGAAATG GTAAAAACAG CGGGTAAAAC TATGGATTTA 
GATGTACAAA TTAATCACTT GGATAATCCT AGAGTAGAGT TAGAGCAACA TTATTTCAAT 
GCTAAAAATA CGAATTTATT AGAGCTTGGT TTAAAACCTC ATTATCTATC TGATTCTTTG 
TTAGATTCTT TGCTCAATTT TGCTATTAAG TATAAAACAA GAGTAGATAA AAACCATATT 
TTACCTAAAG TCTCTTGGCA TCGAGAAAAA ACTCAACAAT TAGATTCTGT AAAAAGTACA 
TTAATATCCA AAACTGAGGA AAAAAACAAA CAATCAGATT CTGTAAAAGT ACAATAG

Protein sequence

MKVLVIGGDG YCGWATALYL SNQGYEVGIL DSMVRRHWDL QLQVETLTPI APIQQRIQRW 
KDLTGKKIDL YIGDITNYDF LSTTLHQFEP ESIVHFGEQR SAPFSMIDRE HAVTTQVNNV 
VGTLNILYAM KEDFPDCHLV KLGTMGEYGT PNIDIEEGYI KIEHNGRTDT LPYPKQPGSF 
YHLSKVHDSH NIHFACKIWG IRATDLNQGI VYGVALTGLL NDETIQDELL INRLDYDGVF 
GTALNRFCIQ AAIGHPLTVY GTGGQTRGFL DIRDTVRCME IAIANPAQPG EFRVFNQFTE 
MFSVLDLAEM VKTAGKTMDL DVQINHLDNP RVELEQHYFN AKNTNLLELG LKPHYLSDSL 
LDSLLNFAIK YKTRVDKNHI LPKVSWHREK TQQLDSVKST LISKTEEKNK QSDSVKVQ