Gene Mpe_A3217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3217
Symbol	pilS
ID	4786556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3421858
End bp	3423786
Gene Length	1929 bp
Protein Length	642 aa
Translation table	11
GC content	71%
IMG OID	640091790
Product	signal transduction histidine kinase
Protein accession	YP_001022405
Protein GI	124268401
COG category	[T] Signal transduction mechanisms
COG ID	[COG5000] Signal transduction histidine kinase involved in nitrogen fixation and metabolism regulation
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.478958
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGCA CGACCGGATC GGGTCGCCGT CGCGCCCCTG CGGATGGCGG GGCGTCGTGG 
TTCGGGTCGA TCGATCTCGG CCTGCCCGGT GACGACGATG CGGCGCAGTC GCGCTTCGAC 
CGTGGCGAGT GGCGCGAGAC CGATGCTGCC GATTCGCGCT TCCTGTCGCG TCAGGCGCGG 
CGGATCGCCG GGTCGGGCCA GAGCGCGGTG TACCGGCTCT ACCGTGCCTT CGTGGCCTCG 
CGCGCGGTGC TCGGTCTCGC GCTGCTGGCC ACCGAGGTGG CGATCACCTG GCTGAGTCCG 
CGGCCACAGC GAGAGCTGGT GCTGTCGCTG TGTTCGCTTT ACGCGATGGC CGCGCTCCTG 
TTGTGGGTGC TGCCCAACCT GCTGGGTCCG ATGCAGCCGG CGCTGCAGTC GCGTCTGCGA 
CGCCGCCACT GGATGGCGAC GATCGGGGTC GACATGTTGA GCTTCGGCGT CCTGCATCTG 
CTGGCCGGCG GCGGCGTGCT GAACTACTCG GCGCTGCTCG TGCTGCCGGT GCTGATGGCC 
GGTGTGCTGA CGCCGCGTCT GCAGGCGTTG GGAGTGGCCG CCGGGTGCAC CTTGATCCTG 
CTTGCTGCCG CGGGGCTCAA TGTGGACGTG ACCGGCGAGG CAACGTTGCA GCTCACGCAG 
GCGGGCCTGG CCGGCGTCGG CCTGTTCGTG GTCAGCCTGA TGGCGGGCGA GTTGTCCGGT 
CGGCTGGCGC GCGAGGAGCT GACGGCGCGC GGCAGCCTCG AATTGGCGCG CCAGCAGGCG 
CAACTCAATC GCCTCGTCCT CGAGGAAATG CAGGACGGCG TGATGGTCGT CGACCGCCGT 
GGCCGGGTGC GCGCCGCCAA CCCGGCGGCG CGCCATCTGC TCGACGAGCC GCTGATCAGC 
GCCGCCGACA GCTTCTCGCT GACCGGTGTG CAGGCCTGGG AGCCCCTGAT CAGCGCCGCC 
GACAGCTTCT CGCTGACCGG TGTGCAGGCC TGGGAGCCCC TGGTCAGGGC CGTGGACCGG 
GCCTTCGGGG AGGGCCACTG GCCCGAGGGG GGGCGCGACG TGGTGTTGCC CCGTGTGGCC 
TCCAGCGATA CGGGGCCACG ACAGCTGCGC CTGCGCGTGC GCTTCACGCG TCGCCGCGAG 
ACGGGGGCGC CGGAGGACTA CTGCGTGCTC TTCCTGGAGG ACCTGCGCAC GGTGCAGGCG 
CGCGTGCGCC AGGAAAAGCT GGCGGCGATG GGTCGCGTGT CGGCCGGCAT TGCGCACGAG 
ATCCGCAATC CGCTGGCGGC GATCATGCAA GCCAATGCGC TGCTGGCCGA AGACGCCAGC 
AGCGCGCAGC AGGTGCAGCT CACGCGCATG GTGGGTGAGA ACGCCGAGCG CCTGAAGCGC 
ATCGTCGACG ACGTGATGGA GGTTGCACCG AGCCTGCTGC CCGAGCCGGC GCCGCTCGAC 
GCGAGTCTGC AGGTCGCCAC CATCTGCGGC GAGTGGGCCC GCACCGCGGG CCTGGCGATC 
GGTGCCGACA GCGTGCTGCG GGTCGACCTG CCGAGCGAGC CGCTCGGCGT GGTGTTCGAT 
GGCGAGCACC TGCGCCGCGT GCTGGTGAAT CTGCTCGACA ACGCGCTGCG GCACGGAAGC 
CGGACGCCCG GTGCGGTCCA ACTGCGGCTC GCTGCGGCGA GCGAAAGCCG AGCCCTGCTC 
ACGGTGGGAA GCGACGGCGA GCAGATCGCG CCGGAGGTCG AGCGTTACCT GTTCGAGCCC 
TTCTTCTCGA CGCGCAGCCG CGGCACCGGA CTGGGACTGT ATATTTGTCG TGAGCTGTGC 
GAGCGCTACG GCGCCAGCAT CGAATTCAGC TCACGCGGCG CGCCGGAGCG CCACCGCAAC 
GTGTTCTCGG TCGCCATGCG GCGCACGCTG CTTCCGGACG GCGATTCCCG GCTTCACTTC 
AGCGCATGA

Protein sequence

MAGTTGSGRR RAPADGGASW FGSIDLGLPG DDDAAQSRFD RGEWRETDAA DSRFLSRQAR 
RIAGSGQSAV YRLYRAFVAS RAVLGLALLA TEVAITWLSP RPQRELVLSL CSLYAMAALL 
LWVLPNLLGP MQPALQSRLR RRHWMATIGV DMLSFGVLHL LAGGGVLNYS ALLVLPVLMA 
GVLTPRLQAL GVAAGCTLIL LAAAGLNVDV TGEATLQLTQ AGLAGVGLFV VSLMAGELSG 
RLAREELTAR GSLELARQQA QLNRLVLEEM QDGVMVVDRR GRVRAANPAA RHLLDEPLIS 
AADSFSLTGV QAWEPLISAA DSFSLTGVQA WEPLVRAVDR AFGEGHWPEG GRDVVLPRVA 
SSDTGPRQLR LRVRFTRRRE TGAPEDYCVL FLEDLRTVQA RVRQEKLAAM GRVSAGIAHE 
IRNPLAAIMQ ANALLAEDAS SAQQVQLTRM VGENAERLKR IVDDVMEVAP SLLPEPAPLD 
ASLQVATICG EWARTAGLAI GADSVLRVDL PSEPLGVVFD GEHLRRVLVN LLDNALRHGS 
RTPGAVQLRL AAASESRALL TVGSDGEQIA PEVERYLFEP FFSTRSRGTG LGLYICRELC 
ERYGASIEFS SRGAPERHRN VFSVAMRRTL LPDGDSRLHF SA