Gene Rcas_1214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1214
Symbol
ID	5538680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1568232
End bp	1569299
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	640893346
Product	glucose-1-phosphate thymidyltransferase
Protein accession	YP_001431329
Protein GI	156741200
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1209] dTDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01208] glucose-1-phosphate thymidylylransferase, long form

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.383113
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAC TGGTTCTCAG CGGCGGCAAA GGAACTCGCC TGCGCCCCAT CACCTATACT 
AGCGCCAAGC AACTGGTGCC GGTCGCCAAC AAACCGGTGC TCTTCCGCGT CATCGAGACG 
ATCCGTGATG CCGGCGTCGA AGACATCGGC ATCGTAATCG GCAGCACCGG ACCCGAAGTG 
CGCGCCGCCG TCGGCGATGG CGGTCGCTGG GGCGTGCGGA TCACCTACAT CGAACAGGAC 
GAGCCGCTGG GGCTGGCGCA CGCCGTCAAG ATTTCACGCG ACTTTCTGGG GGATGACCGA 
TTTGTCATGT TCCTGGGCGA TAACTGCATT CAGGGCGGGA TTGCGCCCCT GCTCCAGCAG 
TTTGGCACGA GCGACTTCAA TGCACAGATC GTCCTCAAGC AGGTCGCTAC CCCTGAGCAG 
TATGGCGTCG CTGTTCTCGA CGAACGCGGA CAGATCGTGC GGTTGATCGA AAAACCGCGT 
CAACCTCCAT CCGACCTGGC GCTGGTTGGC ATTTATATGT TCGACGCAAG CATCTGGGAA 
GCGGTAGAAG CGATTCGCCC GTCGTGGCGC GGCGAACTGG AAATCACCGA CGCGATCCAG 
TGGCTGGTGG AGCATGGGCG ACGCGTCTTC CCCTACATTC ACCACGGTTG GTGGATCGAC 
ACCGGCAAGA AAGACGACAT GCTGGAAGCA AATCGCCTGA TCCTGGAGGA AATGCCGGCA 
TCGGTCGAAG GATTTGTAGA CCGCGACTCG CACCTGATCG GCAAGGTCAT TGTCGAGCGA 
GGGGCGGAAA TCATCAACAG CACCATCCGT GGACCGGCGA TCATTGGTGA ACAGACACGC 
ATTATCAATG CCTATATTGG TCCATTCACC TCGATTTATC ACCACTGCGT CATCGAAAGC 
GCCGAGATCG AGCATTCAAT AGTGCTGGAG CACTGCACCA TCCGCGACCT GCCCCACCGC 
CTGGAAGACA GTTTGATCGG GCGGCACGTC GAGGTCACAC GTTCACCGCG GAAACCCAAG 
GCGTACCGCC TGGTGCTGGG AGATCACTCG AATGTTGGCG TGCTGTAA

Protein sequence

MKGLVLSGGK GTRLRPITYT SAKQLVPVAN KPVLFRVIET IRDAGVEDIG IVIGSTGPEV 
RAAVGDGGRW GVRITYIEQD EPLGLAHAVK ISRDFLGDDR FVMFLGDNCI QGGIAPLLQQ 
FGTSDFNAQI VLKQVATPEQ YGVAVLDERG QIVRLIEKPR QPPSDLALVG IYMFDASIWE 
AVEAIRPSWR GELEITDAIQ WLVEHGRRVF PYIHHGWWID TGKKDDMLEA NRLILEEMPA 
SVEGFVDRDS HLIGKVIVER GAEIINSTIR GPAIIGEQTR IINAYIGPFT SIYHHCVIES 
AEIEHSIVLE HCTIRDLPHR LEDSLIGRHV EVTRSPRKPK AYRLVLGDHS NVGVL