Gene Mpe_A0335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0335
Symbol
ID	4786885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	365220
End bp	366404
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	67%
IMG OID	640088890
Product	methyl-accepting chemotaxis protein I
Protein accession	YP_001019532
Protein GI	124265528
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.809135
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.684623
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTGC TGAACTACCG ACTGACCACT CGCATCGCCG CAGGCTTCAC CATCATGGTG 
GTGCTGACGC TGGCGCTCGG GGCCCTCAGC GTCTGGAACG TGCGCTCGGC CACCGGCGAG 
GCCTATGCCC TGCTCGCCGC CGTGAACGAT CCGGCCGTAT CGACCAAGCT GGGCGACCTG 
CAGAAGAACG CGCAGCGCAC GCTGTGGACG ATCGCCGGCC TGGTGCTGGC GACCGCGGTG 
TTCGGCGCCT GGCTGGGCTG GGCGATCCGC CAGAGCGTGC GGGGGCCCGT CGAAGACGTG 
GTGGCGTCGG TGTCGCGCAT CGCCGCCGGC GACCTGGCGA CGAAGATCTC GTCCAGCGGC 
CGCGACGAGA TCGCCTGGCT GAACCACGAA CTCAACCAGA TGCGCAAGAA GCTGCTGAGT 
ACGATCGCCC AGGTGCGGGA ATCGGCCGAG CAGGTGTCCG TGGCCTCGAA CGAGATCGCC 
TCGGGCAACA CCGACCTGAG CACCCGCACC GAGACCCAGG CGAGCGGCCT GCAGCAGACC 
GCCAGCTCGA TGGAGCAGCT CACGTCGACC GTGCGTCAGA ACGCCGACAA CGCGCAGCAG 
GCCAACCAGC TGGTGGTCAG CGCCAGCGAC GTGGCCAGCC GCGGCGGCGA GGTGATGACG 
CAGGTGGTCT CGACCATGAA CGACATCAAC AGCAGCGCCC GCAAGATCGC CGACATCATC 
GGCGTGATCG ACGGCATTGC CTTCCAGACC AACATCCTGG CGCTCAACGC GGCGGTGGAA 
GCCGCTCGCG CCGGCGAGCA AGGGCGCGGC TTTGCTGTGG TGGCCGGTGA GGTGCGCAAC 
CTGGCGCAGC GCAGCGCCGC TGCCGCCAAG GAAATCAAGA CGTTGATCGG CGACTCGGTC 
GACAAGGTGG AAACCGGCAC GCGGCTGGTC GATCAGGCCG GCTCGACGAT GGACGAGATC 
CTCGCCAGCG TGCGCCAGGT AACGCACATC ATGAGCGAGA TCAGCGTCGC CAGCCGCGAG 
CAGAGCGCAG GCATCGAGCA GGTGAACCGC TCGATCGAGC AGATGGACAG CTCGACCCAG 
CAGAACGCCG CGCTGGTGGA ACAGGCCGCC GCCGCATCGC ATTCGCTGCG CGATCAGTCG 
CACAAGCTGA CCGAAGCGGT GAAGGTGTTC AAGCTGGCGG CCTGA

Protein sequence

MNLLNYRLTT RIAAGFTIMV VLTLALGALS VWNVRSATGE AYALLAAVND PAVSTKLGDL 
QKNAQRTLWT IAGLVLATAV FGAWLGWAIR QSVRGPVEDV VASVSRIAAG DLATKISSSG 
RDEIAWLNHE LNQMRKKLLS TIAQVRESAE QVSVASNEIA SGNTDLSTRT ETQASGLQQT 
ASSMEQLTST VRQNADNAQQ ANQLVVSASD VASRGGEVMT QVVSTMNDIN SSARKIADII 
GVIDGIAFQT NILALNAAVE AARAGEQGRG FAVVAGEVRN LAQRSAAAAK EIKTLIGDSV 
DKVETGTRLV DQAGSTMDEI LASVRQVTHI MSEISVASRE QSAGIEQVNR SIEQMDSSTQ 
QNAALVEQAA AASHSLRDQS HKLTEAVKVF KLAA