Gene Mfla_0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_0587
Symbol
ID	3999057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	611888
End bp	612928
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	64%
IMG OID	637937487
Product	AraC family transcriptional regulator
Protein accession	YP_544698
Protein GI	91774942
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0551242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.259692
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCATCATT GCCTAATCCT ATTTATCACC TATCTTAAAC AGGCCTTATC CTGCAAAATC 
ATCGTCGTTT CATTAATAGA TGGCAGTGCT GAGATGCCCC ATACACAACC CGACCTGTCG 
CGGCAGGCAG AAATGTCCGA ATTGATCCAA CAACTGGCCC CACACGAAGG CCATACCCGC 
TCGCTGCTCG ACGGCGTGCG CCTGATGCGT GCCGACCGAC CCCTGGGACG TACGCCGGTA 
CTGTACGAAC CGAGCATCGT CATCGTCTGC CAGGGCCACA AGCGTGGCTA CCTGGCCGAC 
CGGGTCTACC ACTACGATCC TCAGCACTAC CTGGTGCTGT CGGTACCGCT GCCCTTCTCC 
AGCGAAACCG ATGCCAGCCC CGAGGAGCCC CTGCTGGCGG TATCCGTGCG GCTGGACATG 
ACGGCCGTGG CCGATCTGGT CATCGAGGTC GATCAACAGG CCAGCCCGGT GCCTGCCGCC 
CCTGCGGGCA TCGTTTCAAC GCCATTGGAT GCCACACTGG CAGATACCAC GGTGCGCCTG 
CTGCGGGCCT TGCGCTCAAC ACTGGAAGCG CGGGTGCTGG GCCCGGCCAT CGTGCGGGAA 
CTATGCTTTC GCGTGCTGCT TGGCGAGCAA GGCGGCGCCA TCCGCGCCGC GCTGGCCAAC 
CACGGCAACT TCGGTCGCAT CGCGCGCGTG CTGCGGCGCA TCCACAACGA CTACGCCCAG 
CCGCTGGACG TGGACACGCT GGCGCGCGAA GCGGGGCTGA GCGTGCCGGC CTTCCATGCG 
CATTTCAAGG CCGTGGCTGC CACCTCCCCC ATCCAGTACA TCAAGTCGGT GCGGCTGCAC 
CAGGCACGGC TGATGATGAT TCGCGACAAT GTGACCGCGG CGGGCGCCGC AGCCCGCGTC 
GGCTACGAAA GCCCTTCGCA GTTCAATCGT GAGTTCAAGC GGCTGTTTGG CCGCAGCCCC 
GGCGAGGAAG CACGTGAAAT GCGTTCGGCC TTTGCCTTGA TGGAGCCGGC TCAGCTTGAG 
GCGGCCGCAG CGACCCACTG A

Protein sequence

MHHCLILFIT YLKQALSCKI IVVSLIDGSA EMPHTQPDLS RQAEMSELIQ QLAPHEGHTR 
SLLDGVRLMR ADRPLGRTPV LYEPSIVIVC QGHKRGYLAD RVYHYDPQHY LVLSVPLPFS 
SETDASPEEP LLAVSVRLDM TAVADLVIEV DQQASPVPAA PAGIVSTPLD ATLADTTVRL 
LRALRSTLEA RVLGPAIVRE LCFRVLLGEQ GGAIRAALAN HGNFGRIARV LRRIHNDYAQ 
PLDVDTLARE AGLSVPAFHA HFKAVAATSP IQYIKSVRLH QARLMMIRDN VTAAGAAARV 
GYESPSQFNR EFKRLFGRSP GEEAREMRSA FALMEPAQLE AAAATH