Gene TM1040_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1937
Symbol
ID	4076888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2040105
End bp	2041208
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	59%
IMG OID	638007253
Product	putative GTP cyclohydrolase
Protein accession	YP_613932
Protein GI	99081778
COG category	[S] Function unknown
COG ID	[COG1469] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.166186
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC ATTCTCGTGA TGTAAACGAA ACGCCAGATC GCTCGGACGC GGAACAAGCG 
CTTGCGGTGC TGCGGCGCTG GGCGGGCGAA GCAAGCGAGA CCGAAGTGGC GCAGCTCGAC 
CCTGCGATTG CGCGCCTGCT GCCCGGGCAG GAATTGCAGA ATTACCCCGA CCTCAAGCGC 
CAGTACCCGG ACGACTTTGA TGCAAACGAG TCCTACCGCG CCACGCTCCC GGATCTTCAG 
AACGGCCCTT CCAGCCTGAT CCGCGGCGCC AAGGAGCAGA TCCAGCATGT CGGTATCTCC 
AATTTCCGCC TGCCGATCCG GTTTCATACG CGGGACAACG GTGATCTGAC GCTCGAGACC 
AGCGTAACCG GCACCGTCAG CTTGGATGCG GAGAAAAAAG GCATCAACAT GTCGCGCATC 
ATGCGCAGCT TTTACAAACA TGCTGAGAAG GTCTTTTCTT TCGACGTGAT GGAAGCAGCT 
CTTGAGGATT ATCTGAGCGA TCTTGAGAGT GGCGACGCGC GGCTGCAGAT GCGGTTTTCC 
TTCCCTGTGA AGGTGCAGAG CCTGCGCTCG GGTCTTTCGG GCTATCAGTA TTACGACGTG 
GCGCTGGAAC TGGTGCAGAT GGCTGGGCAA CGCCATCGCA TCGTGCATCT GGACTATGTC 
TATTCTTCGA CCTGCCCGTG CTCGCTTGAG CTTTCGGAAC ATGCCCGTCA GGCGCGTGGA 
CAGCTGGCGA CCCCGCACTC GCAGCGCTCT GTTGCGCGGA TTTCCGTGCA GATGGAACAG 
GATGGCGGCT GTTTGTGGTT CGAGGATCTG ATCGACCATT GCCGTCGCGC GGTGCCGACC 
GAGACGCAGG TGATGGTGAA GCGCGAAGAC GAACAGGCAT TTGCGGAGTT GAACGCGGCC 
AATCCGATCT TTGTGGAAGA TGCGGCGCGC CTCTTTTGTG AAGCGCTTCA GAGCGATGCG 
CGGGTGGGGG ATTTTCGGGT TGTGGCGAGC CATCAGGAAA GCCTGCACAG CCATGACGCG 
GTCTCTGTGC TGACGCAGGG CACGATGTTT GCGGCGCCGA GCCTCGACCC GCAGCTATTC 
TCGACTTTGA TCCATCGCGG TTAG

Protein sequence

MNIHSRDVNE TPDRSDAEQA LAVLRRWAGE ASETEVAQLD PAIARLLPGQ ELQNYPDLKR 
QYPDDFDANE SYRATLPDLQ NGPSSLIRGA KEQIQHVGIS NFRLPIRFHT RDNGDLTLET 
SVTGTVSLDA EKKGINMSRI MRSFYKHAEK VFSFDVMEAA LEDYLSDLES GDARLQMRFS 
FPVKVQSLRS GLSGYQYYDV ALELVQMAGQ RHRIVHLDYV YSSTCPCSLE LSEHARQARG 
QLATPHSQRS VARISVQMEQ DGGCLWFEDL IDHCRRAVPT ETQVMVKRED EQAFAELNAA 
NPIFVEDAAR LFCEALQSDA RVGDFRVVAS HQESLHSHDA VSVLTQGTMF AAPSLDPQLF 
STLIHRG