Gene EcolC_0970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0970
Symbol	nlpD
ID	6068029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1055131
End bp	1056270
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	52%
IMG OID	641600378
Product	lipoprotein NlpD
Protein accession	YP_001723966
Protein GI	170019012
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.957286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGG GAAGCCCAAA ATTCACCGTT CGCCGCATTG CGGCTTTGTC ACTGGTTTCG 
CTATGGCTGG CAGGCTGTTC TGACACTTCA AATCCACCGG CACCGGTCAG CTCCGTTAAT 
GGCAATGCGC CTGCAAATAC TAATTCTGGT ATGTTGATTA CGCCGCCGCC GAAAATGGGG 
ACGACGTCTA CAGCGCAGCA ACCGCAAATT CAGCCGGTAC AGCAGCCACA AATTCAGGCT 
ACTCAACAAC CGCAAATCCA GCCAGTGCAG CCAGTAGCTC AGCAGCCGGT ACAGATGGAA 
AACGGACGCA TCGTCTATAA CCGTCAGTAT GGGAACATTC CGAAAGGCAG TTATAGCGGC 
AGTACCTATA CCGTGAAAAA AGGCGACACA CTTTTCTATA TCGCCTGGAT TACTGGCAAC 
GATTTCCGTG ACCTTGCTCA GCGCAACAAT ATTCAGGCAC CATACGCGCT GAACGTTGGT 
CAGACCTTGC AGGTGGGTAA TGCTTCCGGT ACGCCAATCA CTGGCGGAAA TGCCATTACC 
CAGGCCGACG CAGCAGAGCA AGGAGTTGTG ATCAAGCCTG CACAAAATTC CACCGTTGCT 
GTTGCGTCGC AACCGACAAT TACGTATTCT GAATCTTCGG GTGAACAGAG TGCTAACAAA 
ATGTTGCCGA ACAACAAGCC AGCTGCGACC ACGGTCACAG CGCCTGTAAC GGTACCAACA 
GCAAGCACAA CCGAGCCAAC TGTCAGCAGT ACATCAACCA GTACGCCTAT CTCCACCTGG 
CGCTGGCCGA CTGAGGGCAA AGTGATCGAA ACCTTTGGCG CTTCTGAGGG GGGCAACAAG 
GGGATTGATA TCGCAGGCAG CAAAGGACAG GCAATTATCG CGACCGCAGA TGGCCGCGTT 
GTTTATGCTG GTAACGCGCT GCGCGGCTAC GGTAATCTGA TTATCATCAA ACATAATGAT 
GATTACCTGA GTGCCTACGC CCATAACGAC ACAATGCTGG TCCGGGAACA ACAAGAAGTG 
AAGGCGGGGC AAAAAATAGC AACCATGGGT AGCACCGGAA CCAGTTCAAC ACGCTTGCAT 
TTTGAAATTC GTTACAAGGG GAAATCCGTA AACCCGCTGC GTTATTTGCC GCAGCGATAA

Protein sequence

MSAGSPKFTV RRIAALSLVS LWLAGCSDTS NPPAPVSSVN GNAPANTNSG MLITPPPKMG 
TTSTAQQPQI QPVQQPQIQA TQQPQIQPVQ PVAQQPVQME NGRIVYNRQY GNIPKGSYSG 
STYTVKKGDT LFYIAWITGN DFRDLAQRNN IQAPYALNVG QTLQVGNASG TPITGGNAIT 
QADAAEQGVV IKPAQNSTVA VASQPTITYS ESSGEQSANK MLPNNKPAAT TVTAPVTVPT 
ASTTEPTVSS TSTSTPISTW RWPTEGKVIE TFGASEGGNK GIDIAGSKGQ AIIATADGRV 
VYAGNALRGY GNLIIIKHND DYLSAYAHND TMLVREQQEV KAGQKIATMG STGTSSTRLH 
FEIRYKGKSV NPLRYLPQR