Gene Mfla_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1040
Symbol
ID	4000106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	1081897
End bp	1083534
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	46%
IMG OID	637937940
Product	Rhs element Vgr protein
Protein accession	YP_545149
Protein GI	91775393
COG category	[S] Function unknown
COG ID	[COG3501] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01646] Rhs element Vgr protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.605907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGATAT CTAGCGTCGA AGTGTTGGTT GCTGGAGAGC GATTAAGCAC GCCCCATGCA 
TTATCAATAC AACATCGCTT GAATGCACTG CCTTCTGCAT CTATCCAACT GGCATTCAGT 
TCACTCACAG AACTTGATCA AGTTGCTAAA AGACTACTTC CAGGAAATAA AGTAGACATC 
CACTCGAATG ACACCCCACT ATTTTTAGGC GTTATCGCGA CACAAAAAAT TCAGTACTCG 
GTCAAAGATA CTTTACTTAT CCTGAATTGC TGTCATGCAG CCACTGCATT GACCACCCTG 
CCTCAAAACC AAATTTTTCA TGAAATGACC GATGGTGAAA TCATTCACCA AATACTGGCT 
AGCCACGGCA TCGAAGCCTA CATTGACTCC TCAGGTGTAC AGCATGAGTA TTTAATTCAG 
CACAACACGA GTGACTGGAA TTTTGTCTTG CAACGCCTTC AGGAAACGGG CTTGGTCGCC 
TGTTGTAACG GTAATACCGT CACAGTCACC TCTCCAGAAT TAGGGACGGC AAATGGGTTT 
CCGCTACCAC ATGAAAACAT CATCAACCTA GAGATTGATA TAGACACCTA CCATCAGGTA 
GATGCTTTGG AACTCCAGGC ATGGTGTTAC AGCAATCAGG CGCTGGAGAC TGTTGAAGCA 
AAAAATATTG ATTTTCCAGT CAATGCGCAT CTTTCAGCCT TTGCACTGTT GGGCAAAGAT 
CATCCAGTCA CAAAGGTACA GCGAATTAGC GGGGAATATA CCCTACCTCA ACTCCAAATC 
ATGGCAGATG CCCTACTCGC ATACTCCAGA TTAAGTCTGG TGCAAGGCAC GATTACGGCA 
CAATCCTTAC ATGTCGCCTA TCCAGGACAA ACATTACTAC TGTCAGACAT CAGTCACCAT 
TTATCTGGAT ACTATTACAT TAGTGGGATC ACTTATGAAC TTGCTCCAGG AGCAGCACCA 
GTCACCCACT TCCAGATTGG ATTGCCGCGA AAGATATGCG CTGAGCCAAC CAATAGCAAA 
CAACTCCCCA CCATGCTAAC GGGTATCGTG CAAGAAGTCA GTGATGATCC AGCTGTCAAC 
GAAAGAATCA AAGTCACCTG CCCCTTGATT GATCCCACAG GCCAGGGTGT GTGGGCGCGA 
CTGGCTACAT TACAAGCAGG TGAATTCTCC GGCACGATCT TCACGCCCTC CATAGGCGAT 
GAGGTGATAT TAGGCCTGAA TGGTAGCGAC TTGAATAATA TCGTGGTGAT TGGGGCAGTT 
CATAGCCCAG CCATGCCAAG ACCATGGGCC AATCCAAGCC AGTATGGTTA CAAAAGCCCC 
AACGGGTTAT TGCTATCGCT GGATGACGCA GGACAGGAAA TACAAATATC CACCCAGAAC 
GGTCCATTGT TAAAACTGAG CAAGGATGAA AAAGAAAGTC TCGTGCTTGA AGATCAACAC 
AACAATTCCA TCCATTTCAG CCAAGCCGGA ATACATTTGC AAAGCCGTTG TTTGTCCCTG 
GAAGGCAACG ATATCAAGAT GAATGGACAA AATATTGAAA TAAAGGCTGG ATCCCTCAAA 
CTGAACAGTG AAGCCACTGC CGAAATTAGC GCTACCAGCA TATTGGCCCT CAAGGGAAGT 
ATGATCCACA TCAACTAA

Protein sequence

MTISSVEVLV AGERLSTPHA LSIQHRLNAL PSASIQLAFS SLTELDQVAK RLLPGNKVDI 
HSNDTPLFLG VIATQKIQYS VKDTLLILNC CHAATALTTL PQNQIFHEMT DGEIIHQILA 
SHGIEAYIDS SGVQHEYLIQ HNTSDWNFVL QRLQETGLVA CCNGNTVTVT SPELGTANGF 
PLPHENIINL EIDIDTYHQV DALELQAWCY SNQALETVEA KNIDFPVNAH LSAFALLGKD 
HPVTKVQRIS GEYTLPQLQI MADALLAYSR LSLVQGTITA QSLHVAYPGQ TLLLSDISHH 
LSGYYYISGI TYELAPGAAP VTHFQIGLPR KICAEPTNSK QLPTMLTGIV QEVSDDPAVN 
ERIKVTCPLI DPTGQGVWAR LATLQAGEFS GTIFTPSIGD EVILGLNGSD LNNIVVIGAV 
HSPAMPRPWA NPSQYGYKSP NGLLLSLDDA GQEIQISTQN GPLLKLSKDE KESLVLEDQH 
NNSIHFSQAG IHLQSRCLSL EGNDIKMNGQ NIEIKAGSLK LNSEATAEIS ATSILALKGS 
MIHIN