Gene Rru_A1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1037
Symbol
ID	3833498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	1229625
End bp	1230767
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	67%
IMG OID	637825126
Product	amidohydrolase
Protein accession	YP_426125
Protein GI	83592373
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3454] Metal-dependent hydrolase involved in phosphonate metabolism
TIGRFAM ID	[TIGR02318] phosphonate metabolism protein PhnM

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACG ACGTGTTGCT GACCAATGCC ACCATCGTCG GACGACGCGA GGTTTTCGCC 
GGGTCGCTTC GGATAAGCGG CGAAACGATC GCCGCCGTCG ATCGCGGCGG CTGCGCCCTG 
GCTGGCGCCG AGGATTTGGG GGGCGACATG CTTGTCCCCG GATTGATCGA GTTGCATACG 
GATAACGCCG AGAGCCACCT GGAGCCGCGC AACGGCGTGC GCTGGCCCTT TCCGATGGCG 
GCGGTGCTCG CCCATGACGC CCAGTTGATC GGCGCCGGGA TCACCACGGT TCTCGATGCC 
ATCGCCATTG GCGAGTACCA GGACCGGGGC AGCCGTCGCC AGCTTCTGGC CGAATTGATC 
GCCGCCATCC GCCATGCCCG CGCCCAAGAT CTGCTGCGCG CCGACCACCA GCTTCATCTG 
CGCTGCGAAT TATCCGACCC TTGCGTGGTC GAGTTGTTCG AAACCCATGG CGGCGACCCG 
TTGGTCAGGT TGGTCTCGCT GATGGACCAC ACCCCCGGTC AACGCCAGTT CCGCGATATC 
GAGACCTGGA AGCGTTTCCA TCGCGCCCGC ATGGGCGATG AAGCCGAGAT GGAGCGTATT 
CTCAACCAAG GGCTGGAGCG CCAGGAGCGC ACCGTCACCG ATCATCGCCG GGCCGTCGTC 
GCCTTCTGTC GGGCCCGGGC GATTCTCCTT GCCAGCCATG ACGACACCAC CGAGCAGCAT 
GTGTCCCAGG CCCTGGCCGA TGGCGTGACC ATCGCCGAAT TCCCGGTGAC CATGGCGGCG 
GCGACCCTGG CCCATGGCGC CGGATTGCGC ACGGTCATGG GCGCCCCCAA CGTCGTGCGC 
GGCGGATCGC ACTCGGGCAA TATGGCCGCC ATCGATCTCG CCCGCGACGG CATGCTTGAT 
GCGTTGTCGA GCGATTACGC GCCGATGAGC CTGCTTCACG CCCCCTTTCT GCTCACCGAA 
CGCTTGGGGA TGGCGCTACC CGATGCCCTG GCCCTGGTCA GCGACTCGGT CGCCTCCATG 
CTCGGCCTCG ACGACCGCGG GCGAATCGAA GCCGGCTTGC GCGCCGATCT GCTGCGGGTG 
CGTTTGTGCG ATGGCCTTCC GGTGGTCCGC GCCGTTTGGC GGGGCGGACG CCGGGTTCTC 
TGA

Protein sequence

MSDDVLLTNA TIVGRREVFA GSLRISGETI AAVDRGGCAL AGAEDLGGDM LVPGLIELHT 
DNAESHLEPR NGVRWPFPMA AVLAHDAQLI GAGITTVLDA IAIGEYQDRG SRRQLLAELI 
AAIRHARAQD LLRADHQLHL RCELSDPCVV ELFETHGGDP LVRLVSLMDH TPGQRQFRDI 
ETWKRFHRAR MGDEAEMERI LNQGLERQER TVTDHRRAVV AFCRARAILL ASHDDTTEQH 
VSQALADGVT IAEFPVTMAA ATLAHGAGLR TVMGAPNVVR GGSHSGNMAA IDLARDGMLD 
ALSSDYAPMS LLHAPFLLTE RLGMALPDAL ALVSDSVASM LGLDDRGRIE AGLRADLLRV 
RLCDGLPVVR AVWRGGRRVL