Gene Rru_A2871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2871
Symbol
ID	3836311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	3307070
End bp	3308245
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	68%
IMG OID	637826982
Product	peptidase M20D, amidohydrolase
Protein accession	YP_427955
Protein GI	83594203
COG category	[R] General function prediction only
COG ID	[COG1473] Metal-dependent amidase/aminoacylase/carboxypeptidase
TIGRFAM ID	[TIGR01891] amidohydrolase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCCCG CCATCCCGCC CGCCATCGCG GCGCTGACCG GTGATATGAA AGCGTGGCGT 
CATCATCTGC ACGCCCATCC CGAAACCGCC TTCGAAGAGC ACGCCACCGC CGATTTCATC 
GCCGGGCTGC TCGACGACTT CGGGGTCGAG GTCCATCGCG GGCTGGCCGG AACCGGGGTG 
GTCGGGGTGA TCGCCGGCAA ACGGACGGGA AACCGCGCGA TCGGGTTGCG CGCCGATATC 
GACGCCCTGC ACGTCACCGA GGCCACCGGC CTGCCCCACG CCTCGGTCCA TGCCGGGCGC 
ATGCACGCCT GCGGCCATGA CGGCCACACG GCGATGCTGC TGGGAGCGGC CAAGCATCTG 
GCCGCGACCC GCGATTTCGC CGGCAGGCTG ATCCTCATCT TCCAGCCCGC CGAGGAAAAC 
GAGGGCGGCG GCAAGGTGAT GGTCGAAGAG GGCTTGTTCG ACCGGTTCCC CGTGGATGCG 
GTCTATGGCA TGCACAACTG GCCGGGGCTG GAGGAAGGCC ACTTCGCCCT GCGCACCGGT 
CCGATCATGG CCGGCTATGA CGTGTTCGAG ATCACGCTTA CCGGCAAGGG GGGCCATGCC 
GCCATGCCCC ATCTCGGCAC CGATCAGTTG GTGGCGGCCG GGCATCTGAT GACCGCCTTG 
CAGTCGATCG TCGCCCGCTC GGTCAATCCG ACCGAGGCGG CGGTGGTGTC GGTCACCCAG 
ATGCACGGCG GCGACACCTG GAACGTCCTG CCCGCCAGCG TCGTGCTGCG TGGCACCGTG 
CGCACCTTCA CCAAAGCCGT GCAGGATCTG ATCGAGACGC GGATCACCGA GCTGTCGCGA 
TCGATCGCCC AGGGCTTTGG CGCCGAGGCG GCGATCCATT ACGAGCGGCG CTATCCCGCC 
ACCGTCAACA GCCCCGAGGA AGCCGCCGTC GCCGCCCGCG TGGCCAGCGC CGTGGTCGGC 
GCCGACAAGG TGGACACCAA TTGCCCGCAG ACCATGGGGG CGGAGGATTT CGCCTTCATG 
CTGGGGGTCA AGCCGGGCGC CTATGTGCAG CTTGGCGCCG GCCCGGGGCG GGGCGGTTGC 
ATGCTCCACA ACCCCGGTTA CGACTTCAAC GACGCCCTTC TGGGCGTAGG GGCGAGCTAT 
TGGGTGGGGC TGGTCCACGA CCAACTGGCC GGCTAG

Protein sequence

MTPAIPPAIA ALTGDMKAWR HHLHAHPETA FEEHATADFI AGLLDDFGVE VHRGLAGTGV 
VGVIAGKRTG NRAIGLRADI DALHVTEATG LPHASVHAGR MHACGHDGHT AMLLGAAKHL 
AATRDFAGRL ILIFQPAEEN EGGGKVMVEE GLFDRFPVDA VYGMHNWPGL EEGHFALRTG 
PIMAGYDVFE ITLTGKGGHA AMPHLGTDQL VAAGHLMTAL QSIVARSVNP TEAAVVSVTQ 
MHGGDTWNVL PASVVLRGTV RTFTKAVQDL IETRITELSR SIAQGFGAEA AIHYERRYPA 
TVNSPEEAAV AARVASAVVG ADKVDTNCPQ TMGAEDFAFM LGVKPGAYVQ LGAGPGRGGC 
MLHNPGYDFN DALLGVGASY WVGLVHDQLA G