Gene Rru_A1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1302
Symbol
ID	3833610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	1536036
End bp	1537403
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	68%
IMG OID	637825392
Product	N-formimino-L-glutamate deiminase
Protein accession	YP_426390
Protein GI	83592638
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02022] formiminoglutamate deiminase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAACC TGTTTTTCCA GTCGCTTTTG CTGCCCGAGG GCTGGGCGGA AAACGTCGCC 
ATGACGGTCG ATGAAAACGG CATGATCGCG ACGCTAAGCC CGGGGTCGCC ACCGCCGGCC 
AGCGGCCCGT CGTTCCGCGG CCCGGCCTTC GCCGGCATCC CCAACCTTCA TTCCCACGCC 
CATCAGCGCG CCCTGGCCGG ATCGGGTGAA CGCTCGGGCG GCGATGGCGA GGACAGCTTC 
TGGAGCTGGC GCAAGGCGAT GTACGCCGCC CTGGCCCGCC TGACCCCCGA AGCTTTTGAA 
GATGTGGCCA CCCAGCTTTA TGTGGAGATG GTCAAAGCCG GCTACACCGC CGTCGCCGAA 
TTCCACTATC TGCACCACGA CCGCGACGGC CGCCCCTTCG CCGATCCGGC CGAGATGAGC 
CATCGTCTGG TCGCCGCCGC CCGCACGGCG GGGATCGCGC TGACCCTGCT TCCCGTTCTC 
TACAGCGCCT CGGGCTTTGA TGGCGCCCCG CCCACGGAAG GCCAGAAACG CTTTCACACC 
ACCGGATCGT CCTTTGGCGC CCTGGTCGAG CGCCTGAAGC GCGACTATGG CCGCGACGGC 
GCCATCATGC TTGGCATCGC GCCGCATTCC CTGCGCGCCG TTCCCGCGCC GCTGCTGGCC 
GAGGTGATCG GCGCCCACCC GGAAGGCCCG ATCCACCTGC ATATCGCCGA ACAGACGATC 
GAGGTTACTG ATTGCCTTGC CCATACCGGC CAGCGCCCGG TGGAGTGGCT GCTTGACCAT 
GTCGATCTTG ACCCGCGCTG GTGCCTGATC CATGCCACCC ATGTCACCGA CCAGGAACTG 
GCCGGTATCG CCGCCAGCCG CGCCGTCGTC GGCCTTTGCC CAACGACCGA GGCCAATCTT 
GGCGACGGCC TGTTCCCGGC CGATCGGTTC CTGGGGCTTG GCGGGCGGTT CGGCATCGGC 
TCGGACAGCC ATATCTCGGT CAATCCGGTC GAGGAATTGC GCTGGCTGGA ATACGGCCAG 
CGGTTGACCA CCCGCCGGCG CACCGTGCTG GCCGGCGGCA TCGACCGTTC GACCGGCCGC 
GCCCTGATCG AACAGGCCCA GATCTCGGGG GCGACGGCCT GCGCGATCAA GGCCGGGCGG 
CTGGCGGTCG GCCAGCGCGC CGATATCGTC GTGCTGGATG GCGAGGCGCC CGTGCTGTGC 
GGGCGCTCGG GCGATGGCGC CCTTGATGCC TGGATTTTTT CGGGCAATGC CCCGACCGTC 
CATTCGGTGG TGGTTGGCGG CGCCCTTGTC GTTGAAAATG GCCGCCATCG GGCCGAAGAG 
GCCGTGGCCC GGCGTTTCGC ATCCACCCTT GGGAGACTTC TCGCATGA

Protein sequence

MRNLFFQSLL LPEGWAENVA MTVDENGMIA TLSPGSPPPA SGPSFRGPAF AGIPNLHSHA 
HQRALAGSGE RSGGDGEDSF WSWRKAMYAA LARLTPEAFE DVATQLYVEM VKAGYTAVAE 
FHYLHHDRDG RPFADPAEMS HRLVAAARTA GIALTLLPVL YSASGFDGAP PTEGQKRFHT 
TGSSFGALVE RLKRDYGRDG AIMLGIAPHS LRAVPAPLLA EVIGAHPEGP IHLHIAEQTI 
EVTDCLAHTG QRPVEWLLDH VDLDPRWCLI HATHVTDQEL AGIAASRAVV GLCPTTEANL 
GDGLFPADRF LGLGGRFGIG SDSHISVNPV EELRWLEYGQ RLTTRRRTVL AGGIDRSTGR 
ALIEQAQISG ATACAIKAGR LAVGQRADIV VLDGEAPVLC GRSGDGALDA WIFSGNAPTV 
HSVVVGGALV VENGRHRAEE AVARRFASTL GRLLA