Gene TM1040_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2135
Symbol
ID	4076449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2241583
End bp	2242659
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	67%
IMG OID	638007455
Product	5-amino-6-(5-phosphoribosylamino)uracil reductase / diaminohydroxyphosphoribosylaminopyrimidine deaminase
Protein accession	YP_614129
Protein GI	99081975
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.885222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCTCG CCCTGTCGCT CGGGCGGCGA GGGCAGGGTC GGACTTGGCC AAACCCGGCG 
GTCGGCTGTG TAATTGTCCA AAAGGGTCGC GTGGTGGGCC GGGGCTGGAC CCAGCCCGGA 
GGCCGTCCCC ACGCCGAACC CATGGCGCTG GCGCAGGCGG GAGCCGCAGC GCGCGGCGCC 
ACTGCCTATG TGAGCCTCGA ACCCTGTGCC CATCACGGCA AAACCCCCCC CTGCGCGCAA 
GCGCTGATCG AGGCCGGTGT TGCCCGTGTC GTCGCCGCCA TCGAAGACAG CGACCCGCGT 
GTCAGCGGTC AGGGCTTTGA GATGCTGCGC GCGGCGGGGA TTTCCGTTAC CACCGGAGTG 
CGCGCCGAGG AAGCTGGCTT TGATCACGAA GGGTTCTTTC TAAAAACGGA ACAGGGCCGC 
CCTTTTGTGA CGCTGAAACT CGCCGCGAGT TTTGATGGTC GTATTGCCAC CGGCTCCGGT 
CAAAGCCAGT GGATCACCGG GCCGGAGGCG CGCCGTGTGG TGCATGCGAT GCGTGCGCGT 
CACGATGCTG TCATGGTCGG GGCAGGGACG GCACGCGCGG ATGACCCTTC GCTCACCGTG 
CGCGATCTGG GGATTGACCA GCAGCCGGCG CGGGTGGTGG TCTCGCGCCA TCTTGACCTG 
CCGCTCATCA GCAAGCTTGC GCGCAGCGCA GCGGAGGTCC CGCTCTATCT TTGCCATGGC 
ACAGGCGCGG ATACCGAACG TCTGCGGGCC TGGGACGGGC TGGGAGCGCA TCTGTTGCCG 
TGCAACGCTC TTGGCACCCA GCTTGACCCG CATGATGTGC TGCAGCAACT GGGCAGCGTA 
GGACTCACAC GCGTGTTCTG CGAAGGAGGA GGCGCGCTGG CGGCCAGCCT GCTGGCGCAT 
GACCTCGTGG ATGAGTTGGT GGGCTTCAGT GCTGGTCTGA CGATCGGTGC CGAAGGGCTG 
CCCTCCATCG GGGCGCTTGG CATTGGCCAC CTTTCAGAGG CCCCAAGGTT CGACCTTCAT 
GAGACACGCC CGATTGGCGC CGACATCCTG CACCGCTGGC GTCGCCCTCA GAACTGA

Protein sequence

MGLALSLGRR GQGRTWPNPA VGCVIVQKGR VVGRGWTQPG GRPHAEPMAL AQAGAAARGA 
TAYVSLEPCA HHGKTPPCAQ ALIEAGVARV VAAIEDSDPR VSGQGFEMLR AAGISVTTGV 
RAEEAGFDHE GFFLKTEQGR PFVTLKLAAS FDGRIATGSG QSQWITGPEA RRVVHAMRAR 
HDAVMVGAGT ARADDPSLTV RDLGIDQQPA RVVVSRHLDL PLISKLARSA AEVPLYLCHG 
TGADTERLRA WDGLGAHLLP CNALGTQLDP HDVLQQLGSV GLTRVFCEGG GALAASLLAH 
DLVDELVGFS AGLTIGAEGL PSIGALGIGH LSEAPRFDLH ETRPIGADIL HRWRRPQN