Gene M446_5136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5136
Symbol
ID	6131052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5643813
End bp	5645198
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	67%
IMG OID	641645271
Product	flagellin domain-containing protein
Protein accession	YP_001771896
Protein GI	170743241
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0578954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCC TGCTCACCAA CAGCGCCGCG ATGACGGCCC TGACCACCCT CAAGAGCATC 
AACATCCAGC TCGACACGAC CAGCAACCGC GTCTCCACCG GCCAGCGCGT CTCCAACGCT 
GCCGACAACG CCGCCTATTG GTCGATCGCC ACGACGGTCC GCACGGACAA CAGCTCGCTC 
GGCGCGGTGA AGGACTCGCT CGGGCTCGGC GCCTCGACCA TCGACACGGC CTATAACGGC 
CTCAACAGCA TCCTCACCGA CCTGCAGAAC ATCCGCGCCA AGCTCCAGAC CGCCACCCAG 
GCGGGCGTCG ACCGCGCCAA GGTGCAGACC GAGATCGCGG CGCTCCAGAG CAAGATGAAG 
GCGACCGCCA ACTCGTCGGT GTCGAGCGGC CAGAACTGGA TCTCGGTGGA TTCGTCGGCG 
AGCGACTACC AGGCCATCCG CAAGATCGTG GCCGGCTTCT CCCGCGACTC GGCCGGCGCG 
ATCAACTTCT CGTACGTGAA CGTCGACGTC GGCAGCATCA AGCTGCTCGA CGCCAATTCC 
AGCGCCAGCG TCACCGTCCC GGCCACGTCG GGTCAGGTCT TCGGCAGCAC CTCGCTGACC 
GGCACGACGG CGTTCACCGG CGGCACGGCC GACTTCTCGG CCGCCCAGAC GGTCGAGCTG 
ACGATCACCA CCGAGACCGG CAACGCGACC ATCAAGCTCG ACAAGGCCGC GCTGACCACC 
GCCGCCAAGG ACCTCACCAA GGTCACCACC AACGAGTTCC TCTCGGCGCT CAACAACGCG 
ATCAGCGCCA GCACGCTGAC CACCGCGGGC GTGCCGAGCG TCACCGCCGG CCTGGACACC 
GCGGGCCGCC TGACCTTCAC CCGGACCGCG ACGGGTGCGA CCAATACCGT CAAGGTCGAC 
ACGACGGCCA ACAACACCGT CGACATCGGC TTCGGCGCCG CCAGCGTCAC CGGCTCCGTG 
GCGAAGGGGA CCAACGCGAC CACCACGACC GGCAAGGGCC TGCTCGACAC CTCGAACGGC 
ACCTACACGG CCGGCGGCGG CATGTCGGGC TCCTACAGCG TCGTGAACTT CGACATCTCC 
AAGCTCGTCG GCACCAACGG CGACACCGAC GTGGCCAACA TCATCACCAT GATCGATCAG 
GTGATCGGCA AGGTGACGGA CGCGGGCACC AAGCTGGGCG CGGCCAAGAC GCAGGTCGAC 
GGCCAGAAGA CCTTCGTGGA CACCCTGATG AAGGCGAACA CCGCGACGAT CGGTACGCTG 
GTGGACGCGG ACATCGAGGA GGAATCGACG AAGCTGAAGG CGCTGCAGAC GCAGCAGCAG 
CTGGCGGTGC AGTCGCTGAG CATCGCCAAC TCGTCGAGCC AGAACCTGCT GTCGCTGTTC 
CGCTGA

Protein sequence

MTSLLTNSAA MTALTTLKSI NIQLDTTSNR VSTGQRVSNA ADNAAYWSIA TTVRTDNSSL 
GAVKDSLGLG ASTIDTAYNG LNSILTDLQN IRAKLQTATQ AGVDRAKVQT EIAALQSKMK 
ATANSSVSSG QNWISVDSSA SDYQAIRKIV AGFSRDSAGA INFSYVNVDV GSIKLLDANS 
SASVTVPATS GQVFGSTSLT GTTAFTGGTA DFSAAQTVEL TITTETGNAT IKLDKAALTT 
AAKDLTKVTT NEFLSALNNA ISASTLTTAG VPSVTAGLDT AGRLTFTRTA TGATNTVKVD 
TTANNTVDIG FGAASVTGSV AKGTNATTTT GKGLLDTSNG TYTAGGGMSG SYSVVNFDIS 
KLVGTNGDTD VANIITMIDQ VIGKVTDAGT KLGAAKTQVD GQKTFVDTLM KANTATIGTL 
VDADIEEEST KLKALQTQQQ LAVQSLSIAN SSSQNLLSLF R