Gene Mfla_1798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1798
Symbol
ID	4000545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	+
Start bp	1938793
End bp	1939719
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	62%
IMG OID	637938711
Product	twin-arginine translocation pathway signal
Protein accession	YP_545906
Protein GI	91776150
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.116127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTATCCC GACGCAGTTT CCTCTCAGGT CTTGCAGCGG CTAGCGCAGG CATTGTCCTC 
GCCCGCCATG TATTTGCCAA TCCGTTATCC CCAACCCAAT CGGGGATCAT GCAAACTCGC 
GTTGTTCCGT CCAGCGGCGA GCGTTTGCCC GTGATCGGCA TGGGTAGTTC CGGCAGCTTC 
GAAGTTGGCA ATAGCGCCGC CGAACTCGAC CCCTTGCGTG AAGTACTGCG GCGGTTCTTC 
GCGGGCGGCG CCACTGTGAT CGATACCGCC CCCTCCTATG GCACAGCAGA GAAAGTCATC 
GGGCAATTGC TTGAAGAGCT GGGACTGCGC TCCAGCGCCT TCCTCGCCAC CAAGATCGGC 
ACTTCTGGCC GTGAGGCCGG GCTGGCGCAG TTCCAGGATT CGCTCAAGCG GTTGCGCACG 
GACAAGGTGG AGCTGCTTCA GGTGCACAAC CTGCGGGACT GGCGTACCCA GTTCGAAGTG 
ATCAAGGAAC TCAAGGCCCA GGGCAAGACC CGCTACACCG GGCTCACCCA TTATCTGGAC 
AGCAGTCATG ACGAGCTTGC CGAGGTAGTG CGCAAGGTGA AGCCGGACTT CCTGCAGGTG 
AATTACTCCG TCGTCTCGCG CAACGCAGAG CAAACAGTCT TCCCAGTGGC GCGGGAGCTA 
GGCGTGGCGG TACTGGTCAA CCGCGCTTTT GAGGACGGAC GCCTGTTTTC CAGGGTGCAG 
GGCAAAGCGC TACCGCCATG GGCCGCCGAA GTCGGGATTA CCTCATGGGC GCAAGCTTTC 
CTCAGGTTTG CCCTGAGCCA CCCTGCCGTC ACCACCGTAA TCCCTGCCAC CGGCAAGCCG 
GAGCGCCAGA GCGACAACCT CAAGGCTGGC AGCGGGCCCA TCCTGACCGA AGCGCAGCGG 
CAATCCCTGA TCGACACGGT CGGCTGA

Protein sequence

MLSRRSFLSG LAAASAGIVL ARHVFANPLS PTQSGIMQTR VVPSSGERLP VIGMGSSGSF 
EVGNSAAELD PLREVLRRFF AGGATVIDTA PSYGTAEKVI GQLLEELGLR SSAFLATKIG 
TSGREAGLAQ FQDSLKRLRT DKVELLQVHN LRDWRTQFEV IKELKAQGKT RYTGLTHYLD 
SSHDELAEVV RKVKPDFLQV NYSVVSRNAE QTVFPVAREL GVAVLVNRAF EDGRLFSRVQ 
GKALPPWAAE VGITSWAQAF LRFALSHPAV TTVIPATGKP ERQSDNLKAG SGPILTEAQR 
QSLIDTVG