Gene TM1040_0050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0050
Symbol
ID	4078713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	52702
End bp	53790
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	61%
IMG OID	638005337
Product	GTP cyclohydrolase II
Protein accession	YP_612045
Protein GI	99079891
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.331797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTAA TGCCGACAAT GCTGGAGCGG ATCGCCCGCG CCCGAGTGGA TCTGAGGATG 
GGACTGCCGG TGATCTTGAC CACCGGTGAG AGCGCCATTC TTGCCATTTC CGTCGAGAGT 
CTCAGCCCTG AGCGGCTTAC GGATCTGCGC AGCCTCGGCC CGGTGACTCT GGCGCTGACT 
GCACGGCGGG CGGCCACGCT GAAGGCGCGC GTTTATGACA ATGATATTGC GCGCGTCACG 
GTGCCCAGCG ACGCAGGCCT GGCCTGGGTT CAGGCGCTGG CGGACCCTGC GGATGATCTC 
GAGACCCCGA TGAAAGGCCC CCTATTGAGT GAGCGCGAAG GCGATGCGTC CCTGCCGCGC 
CTTGCAATAG CAATGGTAAA ATCCGCCCGT CTTCTGCCTG CGACCGCCTA CGTCGCGCTT 
GAGAATGCTG GTGACTTTGC GCTGAAACAC GACCTGACCC TGCTGCCGCA GTCCGCAGCC 
GAGCCTCTGC TGAATACCAG CTCGCCCCTC CACCCGGTTG CGGCCGCACG CCTGCCGATG 
GAGGCCTCCG AGGCAGGTCG CTTGCATATC TTTCGCCCAG AGGATGGCGG CGAGGAGCAC 
TATGCGATCG AGATCGGTCG CCCGGATCGG AGCCAGCCAG TCTTGGCGCG GTTACACTCA 
GCCTGTTTCA CCGGTGATGT GTTGGGGTCA TTGAAATGTG ACTGCGGACC GCAGCTGCGC 
GGAGCATTGA GTCACATGGG CCAAGAGGGC GCGGGCATCC TGCTGTATCT CAACCAAGAG 
GGCCGCGGCA TCGGGCTGGC CAATAAGATG CGCGCCTATT CCCTTCAAGA TCAGGGATTT 
GACACAGTCG AGGCCAATCA TCGCCTTGGC TTTGAGGATG ATGAGCGCGA TTTTCGCCTT 
GGCGCGTCGA TTTTGCGCGA ACTTGGGTTT TCTTCCGTGC GCCTCATGAC CAACAATCCC 
GGCAAGATCG CCATGATGGA GAAAACCGGG ATTTCCGTTG TCGAACGCGT ACCGCTCAAG 
GTCGGTGAGA ACGCGTTTAA CCGTCACTAT CTCGCGACCA AGGCTGCAAA ATCAGGCCAC 
ATGCTATGA

Protein sequence

MSLMPTMLER IARARVDLRM GLPVILTTGE SAILAISVES LSPERLTDLR SLGPVTLALT 
ARRAATLKAR VYDNDIARVT VPSDAGLAWV QALADPADDL ETPMKGPLLS EREGDASLPR 
LAIAMVKSAR LLPATAYVAL ENAGDFALKH DLTLLPQSAA EPLLNTSSPL HPVAAARLPM 
EASEAGRLHI FRPEDGGEEH YAIEIGRPDR SQPVLARLHS ACFTGDVLGS LKCDCGPQLR 
GALSHMGQEG AGILLYLNQE GRGIGLANKM RAYSLQDQGF DTVEANHRLG FEDDERDFRL 
GASILRELGF SSVRLMTNNP GKIAMMEKTG ISVVERVPLK VGENAFNRHY LATKAAKSGH 
ML