Gene Mpe_A2867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2867
Symbol	fliC
ID	4785561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3056659
End bp	3057873
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	66%
IMG OID	640091438
Product	flagellin-related hook-associated protein
Protein accession	YP_001022056
Protein GI	124268052
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATGT CAGTCAACAC CAACATCGTT TCGCTCAATG CGCAACGCAA CCTCGGCACC 
TCTCAGTCGT CGCTGGCAAC GTCCATGCAG CGCCTGTCTT CCGGCCTGCG TGTCAACAGC 
GCGAAGGACG ACGCCGCCGG TCTGGCGATC GCCGAGCGCA TGAACGCGTC GGTCCGTGGC 
CTCAATGTCG CGGCGCGCAA CGCCAACGAC GGCATCTCGC TGGCGCAGAC CGCCGAAGGC 
GCGCTGGGCA AGGTCGGCGA CATGCTGCAA CGCATGCGTG AACTGGCCGT CCAGTCGGGC 
AACGCCACCA ACAGCGCCGA CGACCGCAAG GCCCTGCAGG CCGAAGTCAC GCAACTGCGC 
GACGAAATCG ACCGTGTGGC GAAGCAGACG ACCTTCAACG GCCGCAAGCT GCTCGACGGC 
TCCTTCACCG CGGCGGCCTT CCAGGTCGGC GCCGGCGCCG GCGACAACAT CACGGTCGGC 
AGCCTGACGA ACGCATCGGC CAGCAACCTG TCGAAGATCA CCTACGCCGA AATCTCCAGC 
GGTGACCTGG CGAAGGACGA CACCGACATC ACGACGCTGG ACGCGATCGC CGACGGCGAC 
CTGCAGATCA CGATCGACGA CGGCGGCGAC AACGAACTGG TGGTCGAGGT GGGTGCGATC 
GCCCAAGCGA GCTCGGGCTT GGAGCGTCTG GGTCAGGTGG CCGAGGCGAT CAACCGCAAG 
ACCAGCGACA CCGGCGTGTC GGCCTACCTG GTGGCCAATG ACGACGGCAC CTACAAGCTC 
GACATCAAGG CCTCGCGCCT GGATGCCGAC GGTGCCCCGC TGTCGGTGGA GTTCACCGGC 
TTCGATACCA CGACCACGGG TCTGGACGAA GGCGACGTGC CCGCCGCGGT GACGGATGCC 
ATTGGCATCG ACGCGCTGAG CATCGAGACC GAATCGGATG TGTGGGTGTC GATCAAGAAG 
ATCGACAGCG CACTGGACCA GGTGAACAGT GCCCGCGGTA CCCTGGGCGC GATCCAGAGC 
CGCTTCGAGA ATGCGGTGTC GAACATCCAG ATCCAGGCGG AGAACACCGC GGCCTCGCGT 
GGCCGGATCA TGGATGCCGA CTTCGCGTCG GAAACGGCCA ACCTGTCGCG CTCGCAGATC 
CTGCAGCAGG CCGGTACCGC CATGGTGGCC CAGGCCAACC AGCTGCCGCA GCAAGTGCTG 
TCGCTGCTGC GCTGA

Protein sequence

MAMSVNTNIV SLNAQRNLGT SQSSLATSMQ RLSSGLRVNS AKDDAAGLAI AERMNASVRG 
LNVAARNAND GISLAQTAEG ALGKVGDMLQ RMRELAVQSG NATNSADDRK ALQAEVTQLR 
DEIDRVAKQT TFNGRKLLDG SFTAAAFQVG AGAGDNITVG SLTNASASNL SKITYAEISS 
GDLAKDDTDI TTLDAIADGD LQITIDDGGD NELVVEVGAI AQASSGLERL GQVAEAINRK 
TSDTGVSAYL VANDDGTYKL DIKASRLDAD GAPLSVEFTG FDTTTTGLDE GDVPAAVTDA 
IGIDALSIET ESDVWVSIKK IDSALDQVNS ARGTLGAIQS RFENAVSNIQ IQAENTAASR 
GRIMDADFAS ETANLSRSQI LQQAGTAMVA QANQLPQQVL SLLR