Gene Mmar10_2011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_2011
Symbol
ID	4286704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	2192584
End bp	2193549
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	66%
IMG OID	638141512
Product	proline iminopeptidase
Protein accession	YP_757241
Protein GI	114570561
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0118869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCTT CCTACTCACG CCGCCTGCTC TATCCGCCGA TCCGGCCCTT GCAGGCCTCG 
CGATTGGCGG TCGGCAACGG ACATGACCTC TACATTGAGG AGTGCGGCCG GCCGGATGGC 
CTGCCAGTCG TGACCCTTCA CGGCGGTCCC GGTGGCGGCG TATCGCCGGC GCTCAGACGG 
TTTTTCGACC CCCGGCGCTA TCGTGTCATC CTGTTTGACC AGCGCGGTTG TGGTCGTTCG 
ACACCGCATG GCGGGCTCGA GCACAACACC ACGCAGGACC TGATCGACGA CATCGAGCGC 
ATCCGCGAGG TGATGGGGAT CGACAAATGG GTCGTCTTCG GCGGCTCCTG GGGAGCGACA 
CTCGCTCTTG CCTATGCCCG TGCCCATCCG GACCGTTGCA TCGGCCTGAT CCTGCGCGGC 
ATCTTCACCT GCTCCCAGCG CGAGCTGGAC TGGTTTTACA AGGACGGCGC CAACATGTTG 
TTCCCGGATG CCTGGGAACG ACTTGTCGAC CCGCTCAGCC CGGAAGAGCG CGGCGACATC 
ATCCGCGCCT ATTACGAACG CCTCGCCGAG CCGGACATCA TCCGCCGCCG GCCGGATGCG 
CTGGCCTGGG CGCGATGGGA AAGCGCCCTG ATCTCGATGA CCGGCGACCC GTCGGCACCG 
CTGGCCGATC CGGTCCGCTC GGACGCCCTC GCCCGGCTGG AAAGCCACTA CTTCTTCCAC 
AAGGGTTTCT TCCAGCGAGA TGGAGAGCTG ATCGAGGATG CCGAGCGCTA CAATCACCTG 
CCCGGCGTGA TCGTGCAGGG ACGCTATGAC GTCGTGACTC CGCCCCAAAC AGCATGGAGC 
CTCGCCCGGG CTTGGCCGCG AGCGAGGCTC CACATGATTG GCGATGCCGG CCATGCGGCC 
GGCGAGCCGG GCGTGGTCGA CGCGCTGGTG CGCGCGACCG ACGCCTTTGC CGACAAGTTC 
GCCTAG

Protein sequence

MDASYSRRLL YPPIRPLQAS RLAVGNGHDL YIEECGRPDG LPVVTLHGGP GGGVSPALRR 
FFDPRRYRVI LFDQRGCGRS TPHGGLEHNT TQDLIDDIER IREVMGIDKW VVFGGSWGAT 
LALAYARAHP DRCIGLILRG IFTCSQRELD WFYKDGANML FPDAWERLVD PLSPEERGDI 
IRAYYERLAE PDIIRRRPDA LAWARWESAL ISMTGDPSAP LADPVRSDAL ARLESHYFFH 
KGFFQRDGEL IEDAERYNHL PGVIVQGRYD VVTPPQTAWS LARAWPRARL HMIGDAGHAA 
GEPGVVDALV RATDAFADKF A