Gene Nmul_A0871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0871
Symbol	prpD
ID	3784441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	989317
End bp	990768
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	57%
IMG OID	637810953
Product	2-methylcitrate dehydratase
Protein accession	YP_411566
Protein GI	82702000
COG category	[R] General function prediction only
COG ID	[COG2079] Uncharacterized protein involved in propionate catabolism
TIGRFAM ID	[TIGR02330] 2-methylcitrate dehydratase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000221374
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCCG CGTCCTCCCA CATTCGTCCC CAGCCTGACC AGGTTCTGGT CGACATTGCA 
GATTATGTGG TGGGACGGGA TATTCAAAGC GATCTGGCTT ACGCTACCGC CCGTCACTGC 
CTGATGGATT CCCTGGGGTG CGCCATGGAA GCGCTTGCGT ATCCGGCCTG CACCAAGCTG 
CTTGGGCCGC TCGTGCCCGA GGCTGCCGAA TCTGAGGGCG GCGCGAGGAT TCCGGGTACC 
CAGTTTCAGT TCAATCCGGT GGAAGCGGCA TTCAATATCG GCACGATGAT TCGCTGGCTC 
GATTTCAACG ATACCTGGCT GGCTGCGGAA TGGGGTCATC CATCGGATAA CCTGGGGGCC 
ATACTGGCTG TAGCCGACTG GCTTTCGCGC AGTGCCACGA GCGGGAGGCG GCGGCCGCTT 
ATGCGCGATG TGTTGACCGC GATGATAAAG GCATACGAGA TCCAGGGTTG CTTCGCTTTG 
GAAAACAGCT TCAACAGGGT GGGCCTGGAT CATGTGGTGC TGGTTAAAGT TGCCTCCACA 
GCCGTCGTAA CGCATCTGCT GGGCGGCAGC CGTAAACAGA TCGTCGATGC GCTTTCCCAG 
GCGTGGGTGG ACGGGCAGGC ACTTCGCACG TATCGTCATG CCCCCAACAC CGGCTCGCGC 
AAATCCTGGG CTGCGGGGGA TGCCACCAGT CGTGCGGTAT GGCTTGCGCT GATCACACTC 
AAGGGGGAGC CAGGCTATCC TTCAGCGCTT ACCGCGAAAA CCTGGGGGTT CTACGATGTG 
CTGTTCAAGG GAGAACCTTT CAAATTCCAG AGGCCCATCG AACGATGGCA TTCCTATGTA 
ATGGAGAATG TGCTGCTCAA GATTTCGTTC CCCGCCGAAT TCCACTCCCA GACAGCGGCG 
GAGTGTGCGA TGCAGCTATA CCCGCACGTG AAGGACCGGA TTGCCGATAT CCGGAAAATA 
ACGATCCGCA CCCACGAGGC CGCGATTCGT ATCATCGACA AGAAGGGGCC GCTCAGCAGC 
CCGGCCGACC GCGACCATTG CATGCAGTAT ATCGTGGCAG TGGCCCTTAT TTTCGGCAGG 
CTTACCTCTG CCGATTATGA GGATGGCGTG GCCGCCGACC CTCGCATAGA TGCGTTGCGG 
GACAAGATAA TCTGTATTGA GGATCCGTGC TTCACAAAGG ATTATTACGA TCCCGAAAAA 
CGCTCCATCG CAAACGGTCT CACCCTTGAA TTCAGGGACG GCAGTAAACT GGAGGAAGTG 
GTGGTGGAGT ATCCCATCGG CCACAGGTTG CGTCGAAGCG AAGGCATTCC GCTACTGGAA 
GAAAAATTTA GAATCAATCT TGGGCGGCGT TTCCCCGCCC AGCAGTGCGA GGCAATCATG 
AATGCCTGTC ATGATCAAGG CAGGCTGGAA GCAATGCCGG TTCACGAGTT TATCGATCTG 
TTTGTGATTT AG

Protein sequence

MSSASSHIRP QPDQVLVDIA DYVVGRDIQS DLAYATARHC LMDSLGCAME ALAYPACTKL 
LGPLVPEAAE SEGGARIPGT QFQFNPVEAA FNIGTMIRWL DFNDTWLAAE WGHPSDNLGA 
ILAVADWLSR SATSGRRRPL MRDVLTAMIK AYEIQGCFAL ENSFNRVGLD HVVLVKVAST 
AVVTHLLGGS RKQIVDALSQ AWVDGQALRT YRHAPNTGSR KSWAAGDATS RAVWLALITL 
KGEPGYPSAL TAKTWGFYDV LFKGEPFKFQ RPIERWHSYV MENVLLKISF PAEFHSQTAA 
ECAMQLYPHV KDRIADIRKI TIRTHEAAIR IIDKKGPLSS PADRDHCMQY IVAVALIFGR 
LTSADYEDGV AADPRIDALR DKIICIEDPC FTKDYYDPEK RSIANGLTLE FRDGSKLEEV 
VVEYPIGHRL RRSEGIPLLE EKFRINLGRR FPAQQCEAIM NACHDQGRLE AMPVHEFIDL 
FVI