Gene Tery_2464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2464
Symbol
ID	4244649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	3791090
End bp	3792550
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	41%
IMG OID	638107549
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_722148
Protein GI	113476087
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGACAG AATGGATCGC CAAACGTAGT GGACACAAAA ATGTCTCTCA GATGCACTAC 
GGTCGTCAGG GAATCATCAC TGAAGAAATG AACTTTGTGG CCCAACGAGA AAATCTTCCT 
GCTGAGTTAA TTCGTGCAGA AGTAGCAAGG GGACGAATGA TTATCCCTGC GAATATTAAC 
CACACTAACC TTGAACCAAT GTGTATTGGA ATTGCTTCTC GGTGTAAAGT TAATGCCAAC 
ATTGGCGCCT CTCCCAATAC TTCTGATATT ACTAAGGAAG TTGATAAACT AAAACTATCC 
ATTAAATATG GTGCAGATAC CGTGATGGAC TTATCCACAG GTGGCGGTAA CTTGGATGAA 
ATTAGAACTG CTATTATCAA CGCTTCCCCA GTACCTATCG GAACAGTACC AGTATACCAA 
GCAGTAGAAA GCGTTCATGG CAGAATAGAA AATCTGACTG CTGATGACTT TCTTCATGTT 
ATTGAAAAGC ATGCTCAACA AGGGGTAGAC TATCAAACCA TCCACGCCGG AATTTTAATT 
GAACATCTAC CTCTAGTCAG AAGCCGTATC ACTGGTATAG TTTCCCGTGG CGGTGGAATT 
ATCGCCAAGT GGATGCTCCA CCATCACAAA CAAAATCCTC TTTATACTCA TTTTGACGAT 
ATTATTGAAA TCTTCAAAAA ATATGATGTT TCCTTTAGTT TAGGAGATTC TCTACGACCC 
GGTTGTACCC ATGATGCTTC TGATGAAGCC CAACTAGCAG AATTAAAAAC ATTAGGTCAG 
TTAACTCGCC GTGCCTGGGG ACATGAAGTT CAAGTTATGG TAGAAGGTCC TGGTCATGTA 
CCAATGGACC AAATTGAGTT TAATGTGAAA AAACAAATGG AAGAGTGTTC AAGTCCTCCT 
TTGAATGCTT TGGATCTAGA TCCCTTAGCA TCCAACGCCA ATGAACAGAT GGAAAAGTTT 
AATGTTCTAG GTCCAGCTCC TTTCTATGTT TTAGGTCCAT TAGTCACAGA TATTGCTCCT 
GGTTATGATC ATATTACTTC TGCTATTGGT GCAGCAATGG CGGGATGGTA TGGTACAGCA 
ATGTTATGTT ACGTTACTCC GAAAGAACAT TTAGGTTTGC CTAACGCTGA GGATGTCAGA 
AATGGACTCA TTGCTTATAA AATTGCAGCC CATGCAGCAG ATATTGGTCG GCATCGTCAG 
GGAGCGAGGG ATAGAGATGA TGAACTTTCT GCTGCTCGTT ACAATTTTGA TTGGAACCGT 
CAATTTGAGT TATCTTTAGA TCCAGAGCGA GCCAAAGAAT ATCACGATGA AACTTTGCCT 
GCGGATATCT ATAAAACTGC TGAATTTTGT TCTATGTGCG GACCAAAATT CTGTCCGATG 
CAAACTAAGG TTGATGCTGA CGCTTTGACA GAATTAGAGA AGTTTTTAGC CAAGGAAAAA 
GAAGTTGTAA CTCAAAGTTA A

Protein sequence

MRTEWIAKRS GHKNVSQMHY GRQGIITEEM NFVAQRENLP AELIRAEVAR GRMIIPANIN 
HTNLEPMCIG IASRCKVNAN IGASPNTSDI TKEVDKLKLS IKYGADTVMD LSTGGGNLDE 
IRTAIINASP VPIGTVPVYQ AVESVHGRIE NLTADDFLHV IEKHAQQGVD YQTIHAGILI 
EHLPLVRSRI TGIVSRGGGI IAKWMLHHHK QNPLYTHFDD IIEIFKKYDV SFSLGDSLRP 
GCTHDASDEA QLAELKTLGQ LTRRAWGHEV QVMVEGPGHV PMDQIEFNVK KQMEECSSPP 
LNALDLDPLA SNANEQMEKF NVLGPAPFYV LGPLVTDIAP GYDHITSAIG AAMAGWYGTA 
MLCYVTPKEH LGLPNAEDVR NGLIAYKIAA HAADIGRHRQ GARDRDDELS AARYNFDWNR 
QFELSLDPER AKEYHDETLP ADIYKTAEFC SMCGPKFCPM QTKVDADALT ELEKFLAKEK 
EVVTQS