Gene M446_3937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3937
Symbol
ID	6130256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	4385627
End bp	4387111
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	67%
IMG OID	641644095
Product	flagellin domain-containing protein
Protein accession	YP_001770737
Protein GI	170742082
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0911529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00880768
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

TTGACGAGCC TGCTGACCAA CTCCGCCGCG ATGACGGCGT TGACCACGCT GAAGTTGATC 
AACGCGAACC TCGACACCAC GAGCAACCGG GTGTCGACGG GCCAGCGCGT CTCGGCCGCG 
GCCGACAACG CCGCCTACTG GTCGATCGCG ACCGCGGTGC GCTCCGACAA CGCCTCGCTC 
GGCGCCGTGA AGGACTCGCT CGGCCTGGGG GCCTCCGCGG TGGGGACGGC CTATAACGGC 
ATCAATAGCA TCATCTCGGA CCTGCAGAAC ATCCGGGCCA AGCTGCAGAC CGCCCTCCAG 
GGCGGGACCG ATCGCAGCAA GGTGCAGACC GAGATCTCCG CCATCCAGAA CAAGATGAAG 
GCCACGGCCG ACTCGTCCGT GTCGAACGGA GTGAACTGGC TGTCGGTGGA TTCCTCGGCC 
ACGAACGCGC GGTTTCGTCC GGTGGAGAGC GTGGTGGCGG GCTTCGCGCG CAATGCCGCC 
GGCACCGTCT CGTTCTCGAC CATCGACGTC AACGTGAACG CGATCAAGCT CTACGACGTC 
AACGCGACCA GCATCACCTC GGCGGCGACC CAGGCGCAGT TCACGGCAGG CCAGTCGCTC 
ACCGGGACGC CGCTCTTCAC GAACGGGACG GCCGACTTCT CGGGCACGAA CGAGGTCAAC 
TTCACCCTCC AGATCGACCG GCTCGGCACC GCGGGTGGGG CGGCCGGAAC GGCCGCGGGC 
GCCTATGGCG GCAAGGTGAA CATCGTCCTG AACAATTCGA CGCTGATAAC GGCGGCAAAC 
GATCGCTCGA AGGTCACGAC GGACGAATTC CTGAGAGCCA TCAACAACGT CATCGGCGCG 
AGCACGTTGC CCCAGACGGG AGCCGGCGGC TCCGCGGTGG CGATCACGAC GGGCGGGCTG 
AAGGGCCTGA TCACCGCCGC CCTCGATTCC TCGGGCCGGC TGGTCTTCCG CACCACGGAT 
ACCGGCGCGA CCCTGACCGC CACCCTGACC GTCGGGACCG CCACGGCGGG CAACACGCTG 
AAGGATTTCG GCTTCGGCAC GACGGCGGGG CTCGCGGCCA CCGGCAAGGG CACGGATGCG 
GGAACCACCA CGGCCCGCGG CATCATCGAC ACGAGCGTCG GCAGCTACGA TGCCTCCTTC 
GGCGGCGGCA GCTACTCGAT CGCCAATTTC GACATTTCGA AGCTGGTCGG GACGGCCGGC 
GACAGCAACC TCAAGGACAT TATCGCGGCC GTCGACAAGG CCCTGGCGGC GGTCACCGAT 
GCCGGCACCA AGCTCGGCGC GGGCAAGAAC CAGATCGAAG GCCAGACGAG CTTCGTCGAC 
TCGCTCATGA AGGCGAACAC CGCCACGATC GGCACCCTGG TCGACGCCGA CATCGAGGAG 
GAATCGACGA AGCTGAAGGC GCTGCAGACG CAGCAGCAAC TCGCCGTCCA GGCGCTCAGC 
ATCGCGAATT CCTCAGGGCA AGCCCTGCTC ACCCTGTTCC GCTAA

Protein sequence

MTSLLTNSAA MTALTTLKLI NANLDTTSNR VSTGQRVSAA ADNAAYWSIA TAVRSDNASL 
GAVKDSLGLG ASAVGTAYNG INSIISDLQN IRAKLQTALQ GGTDRSKVQT EISAIQNKMK 
ATADSSVSNG VNWLSVDSSA TNARFRPVES VVAGFARNAA GTVSFSTIDV NVNAIKLYDV 
NATSITSAAT QAQFTAGQSL TGTPLFTNGT ADFSGTNEVN FTLQIDRLGT AGGAAGTAAG 
AYGGKVNIVL NNSTLITAAN DRSKVTTDEF LRAINNVIGA STLPQTGAGG SAVAITTGGL 
KGLITAALDS SGRLVFRTTD TGATLTATLT VGTATAGNTL KDFGFGTTAG LAATGKGTDA 
GTTTARGIID TSVGSYDASF GGGSYSIANF DISKLVGTAG DSNLKDIIAA VDKALAAVTD 
AGTKLGAGKN QIEGQTSFVD SLMKANTATI GTLVDADIEE ESTKLKALQT QQQLAVQALS 
IANSSGQALL TLFR