Gene Mext_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0349
Symbol
ID	5832109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	397030
End bp	398124
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	66%
IMG OID	641366135
Product	flagellin domain-containing protein
Protein accession	YP_001637844
Protein GI	163849801
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTGCG TCTTCACGAA CCCCGCGGCT GTCGTCGCGC TGCAGACCCT GCGCGCGGTC 
GTCAGGGACC GCGACGCGAC CTTGCGACGG CTTTCGACTG GATTACGGAT CGGCTCGGCT 
GCGGACGAGG CGGCCTACTG GGCCATCGCC TCGACCCTGC GGGCGGACAA CGGCTCGCTT 
GCCACGACGC GAGATGCCAT CAGCCACGAC CGCAACACTG TCGAGGCCAT GGCCCGGCGC 
TTGGATCGGG TGATCGACCA ATTGGGCGCT ATCGGTCGCA CGCTGGTCTC GGCCTCCGGC 
GCGCAGGCCG ACACGACCAA GCTGCAGGTC GACCTGCGCA TCGCTCTCGA TGCCATCCGG 
CTCACGGCGG ACAACGCCAT CATGAACGGC GCGAACTGGC TCTCGGTTAA TTCGGAGGAG 
CCCAATTTCT CGGTGACCCG GAACCTCGTC ACGGCCTTTT CTTGCCAGGG CGGCAGCGTT 
GCGGTCGGAA CCTCGGCCTT CGACACCTCG GGCATCATCC TGTTCGACGC CCGGGCTCGG 
GAGGACGGCA GAGGCGCTTT CAGCCGCACG CCGGCCGTCG GCTGCATCCC GACCCTGGCC 
CGGGGCATAG CTCGGACCGC ATCGGTGGCA TCCCCCGATG GCTACAGACT CCAGACTTGG 
GACGGGCCTA GCCAGCGTGG CGGCCAAACC CTGTACCTGA CTTGGAACCA CGGCCTGCTC 
GACACGCAGT TCTACGTCCG AGACGGCAAC GCCGAGCAGC AGCCCTTCTC CATCGCCTCG 
ATGGACCTGA CGTCGCCTTA TGCGGATGCC AAGATGATCC AGGCATACGC CAAGGTGGTG 
GACGCTACCC TGCAGGTACT GCTCGATGGG GCCGCGAAGC TCGGCGCGAC TTCCGCCCTG 
CTCTCGTTGC AGCAGAATTT CGCGGGTAGG TTGATGGACA TCAATGCTTC CGCAATCGGC 
GCGCTGGTCG ACGCCGACAT CGAGGAGGCC TCGGCGCGGC TGAAGGCGCT CCGAGTGCAG 
CAGCAACTCG GGCTGCAATC GCTGAACATC GCCAATGGCG CCTCCCAGGC CATCCTCGTC 
CTGTTCCGGC AGTAG

Protein sequence

MTCVFTNPAA VVALQTLRAV VRDRDATLRR LSTGLRIGSA ADEAAYWAIA STLRADNGSL 
ATTRDAISHD RNTVEAMARR LDRVIDQLGA IGRTLVSASG AQADTTKLQV DLRIALDAIR 
LTADNAIMNG ANWLSVNSEE PNFSVTRNLV TAFSCQGGSV AVGTSAFDTS GIILFDARAR 
EDGRGAFSRT PAVGCIPTLA RGIARTASVA SPDGYRLQTW DGPSQRGGQT LYLTWNHGLL 
DTQFYVRDGN AEQQPFSIAS MDLTSPYADA KMIQAYAKVV DATLQVLLDG AAKLGATSAL 
LSLQQNFAGR LMDINASAIG ALVDADIEEA SARLKALRVQ QQLGLQSLNI ANGASQAILV 
LFRQ