Gene Mfla_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1041
Symbol
ID	4000107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	1083531
End bp	1085030
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	49%
IMG OID	637937941
Product	hypothetical protein
Protein accession	YP_545150
Protein GI	91775394
COG category	[R] General function prediction only
COG ID	[COG3497] Phage tail sheath protein FI
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGAACT ATCAACATCC TGGCATTTAT GTACAGGAAA TAGCTATTGC ACCCAACATT 
GAGCCTGTTG CCGCATGCCT GCCCCTATTC ATTGGCCATA CAGAAAAATC CCAGGATGCC 
AATGGACATC CATTACCATT GGGTAAGCGC TACAGCGTTT CCTCACTTGC AGAATACGAA 
GAACACTTTG GCAAAGGTGC GCCAGAAACC CTACGCGTGC TATTGGACGG CAAAGGTAAT 
ATCGTCAATG CCCACAGCTA CAGTCCTTTT TACCTTTATG CAGCCGTACA TCAATACTTC 
GCCAATGGAG GTGGACAATG CGAAATTCTT TCCGTTGGCC CATATTCCCG GGCACCAGAT 
GCTTCTGCGC TGAAAGCGGC CATTAGAGCA TTACCCCTAA ACGCCGCATT TACACTGGTT 
GCGATCCCCG ATGCTGTTTC GCTAGCAGAA TTACCTCAAC TCCAAAGGAA ACTACTGCAA 
TATTGTGCAC AACAGGATTA TTGCCTAGCA ATTCTGGATG TCCCCTATTG CAATGACCAG 
ACTCGGGAGA TGACGGTCAA TACGTTCCGC CATGATATCG GTCAGCGAGG CCTGCAACAC 
GGTGCAGCGT TCATGCCATG GCTGGAAACA GCTGCGGCTG GCATCTCAGG CTATGTCGAC 
CTGGAAATCA AATATACGCC TGGCGTTGCC ACAGCCTGGA ATGATTTTCA CAAAGCCACC 
AAGCTCCAAT CTCACCTGCT TCATAAACAA CTGGAAGCAT CCCCTGCGAT ACGATTCAAC 
AGGATGCTTC CTCCCAGCGG CAGCATCATG GCATTATTTG AAGCCAATGC CCGCAAGCGT 
AACATTTGGA CAACCCCTAA CCATACCCCC ATCAAGGAAA TCATTTCATT AAGCGCCACC 
ATTGATAACA TCATTCAAGA ATCGCTGAAT ATTCACCCAA CAGGTAAATC AATCAATGCC 
ATTCGTCGCT TCGACAATGC TCTCTTGATG TGGGGAGGAC ACACATTAGC CAGCAATGAC 
AGCGAATGGC GTTATATAGC CCATTTGCTT ACCCGTGGAT TTGTGCAGGC CTCTCTACGT 
CGATTCCTGG ATCAGCAAAC CTTTGAGAAA AATGATGAAG CTACATGGAG TTTGGTTGGT 
CACCAGTGCC AGGATTTTCT GCACACGCTT TGGCGGGAGG GTGCTTTAGT TGGAGATAAA 
CCTGAACAAG CATTCTATGT CAGGATAGGC CTTAACCAGA CCATGTCCAC CCAGGATATC 
GCAGCGGGAC GAATAATTGT GCATGTAGGC ATTGCCTTGC TCAGGCCTGC CGAATTTATC 
ATACTAAAGC TACATAAAGT CATATCAGCC CCCGACTTGA AACCAGCAAT CACCAGGCCT 
GGAAAACCGG TAAATCGAGT CAAGATCCGG GCTAAGACAA GCCCGATCAA TGTTGTCATC 
CGTCAGCGAC AACAACCCAG TCCTCCTAGC AAACCTTTGC CATCGGAGCC GGTTTCGTGA

Protein sequence

MGNYQHPGIY VQEIAIAPNI EPVAACLPLF IGHTEKSQDA NGHPLPLGKR YSVSSLAEYE 
EHFGKGAPET LRVLLDGKGN IVNAHSYSPF YLYAAVHQYF ANGGGQCEIL SVGPYSRAPD 
ASALKAAIRA LPLNAAFTLV AIPDAVSLAE LPQLQRKLLQ YCAQQDYCLA ILDVPYCNDQ 
TREMTVNTFR HDIGQRGLQH GAAFMPWLET AAAGISGYVD LEIKYTPGVA TAWNDFHKAT 
KLQSHLLHKQ LEASPAIRFN RMLPPSGSIM ALFEANARKR NIWTTPNHTP IKEIISLSAT 
IDNIIQESLN IHPTGKSINA IRRFDNALLM WGGHTLASND SEWRYIAHLL TRGFVQASLR 
RFLDQQTFEK NDEATWSLVG HQCQDFLHTL WREGALVGDK PEQAFYVRIG LNQTMSTQDI 
AAGRIIVHVG IALLRPAEFI ILKLHKVISA PDLKPAITRP GKPVNRVKIR AKTSPINVVI 
RQRQQPSPPS KPLPSEPVS