Gene Mfla_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1842
Symbol
ID	4000969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	1980615
End bp	1981685
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	57%
IMG OID	637938758
Product	rhomboid-like protein
Protein accession	YP_545950
Protein GI	91776194
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000517898
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACC TAACCGATAG CTGGCCTTCC CTAGGTGCTG CAATCAAGCA GCGCACGCCA 
GGCATCCCGG TGACCAAGTG CCTCATCGCG GCCAACTTGC TGGTATTTGT GCTGATGCTG 
TTCAATGGTG CTGGTTTCTG GCACTCCCCC AACAATGTGC AGCTGCAGCT TGCATGGGGT 
GCCAACTTCG GTCCTGCGAC GCAGGATGGG GAATGGTGGC GTTTGTTCAC CGCCTTGTTC 
TTGCATTTCG GCGCTGTGCA CCTGGCATTG AACATGATTG CATTCTGGGA TGGCGGGCAG 
CTCGTGGAGC GCATGTATGG CCATTGGCGC TACCTGGTCA TCTATCTGGT CAGCGGCTTG 
GTCGGTAACC TGCTTTCGCT GGTGTGGCAG GGCAACCAGG CGGTATCTGG TGGGGCATCT 
GGCGCGATTT TCGGCATTTA TGGCGCCTTG ATCGTATTTC TCTGGCAAGA ACGGGCGTTG 
CTAGACCGAC GCGAGTTCCG TTGGCTGTTC GGGGGCGCCT GCGTATTCGC AACCGCCACC 
ATTGCGCTGG GCTTCATGAT TCCCGCGATT GACAATGCCG CACATATTGG CGGCTTTGTC 
GCGGGCATGC TGGCTGGATT GCTGCTGATG CGCGGCTTGA GGCCGCAAGA GGTAGTGCCA 
CGTTTGCCCC GGCTGATCGG CGGCAGCCTG CTGGTAGCTG CTATTGCCAT CATGCTATAC 
AAGCTTCCAG CGCCTAAATA CAGCTGGGGC GATGAGCTGC TGCTGCAAAA GGAAATCAAT 
GCTTTCATTC AGGAAGATCA GGCGATCAAC CGTTCTTGGC TGCATATCAT GCATGAGAGC 
AAGCAGGGCA ATGTGACATA TTTTGAGCTG GGCGAGCAGA TCGAGAACGA TATCACCGAC 
CGCTATCAGG AACGCTATGA GGCCTTGTCG CAACTGCCCT ATGATCCTAA TCTACCGTCT 
GCCGCCAAGC TAGAGAACAT ACTGCAATAC ACCAAGCAGA AGCGCGATGC TTCGCGGGCT 
TTGGCCGAGG AGCTCAAGCA GGGCAGAAAG CCGTCTAAAC CTGCGCCCTG A

Protein sequence

MTDLTDSWPS LGAAIKQRTP GIPVTKCLIA ANLLVFVLML FNGAGFWHSP NNVQLQLAWG 
ANFGPATQDG EWWRLFTALF LHFGAVHLAL NMIAFWDGGQ LVERMYGHWR YLVIYLVSGL 
VGNLLSLVWQ GNQAVSGGAS GAIFGIYGAL IVFLWQERAL LDRREFRWLF GGACVFATAT 
IALGFMIPAI DNAAHIGGFV AGMLAGLLLM RGLRPQEVVP RLPRLIGGSL LVAAIAIMLY 
KLPAPKYSWG DELLLQKEIN AFIQEDQAIN RSWLHIMHES KQGNVTYFEL GEQIENDITD 
RYQERYEALS QLPYDPNLPS AAKLENILQY TKQKRDASRA LAEELKQGRK PSKPAP