Gene Mfla_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_1003
Symbol
ID	3999662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	+
Start bp	1042652
End bp	1044085
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	54%
IMG OID	637937903
Product	peptidase S1C, Do
Protein accession	YP_545112
Protein GI	91775356
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0749587
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0653423
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAA AGCTAATTGC CATGTCAGCA ATTTGTTTAT TTGTTGGTAT GGCGGGGGCA 
ACGCCGGTTT TAGCCAAGGA ATTGCCCGAT TTTACCGAGC TGGCGGAAAA GCAGGGAGCG 
GCAGTGGTCA ATATCAGCGT GACCCAGGTC GTACAGTCTG GAATAGGTGG ATCTCCTTTT 
CCCGGATTCC CCGAAGATGA GGCATTGAAT GAATTCTTTC GCCGTTTTGG CATTCCAGGG 
TTTCCGGGTG TGCCGCGCGG ACAAGGTGGT CCACAGCAAC CTGAATTTAA ATCCCAGTCC 
CTCGGGTCAG GATTCATCAT TAGCAGCGAT GGTTATATCC TGACGAATGC CCATGTAGTT 
CGCGAAGCCG ATGAAGTGAT CGTCAAGCTG AATGATAAAC GTGAATTTCA GGCCAAGATT 
GTGGGGGTTG ACCGCCGCAC GGATGTCGCG CTGCTTAAAA TTGATGCGAC AGGGCTGCCG 
AAGGTCACCA TTGGCAATCC TGAGCAACTG AAGGTAGGGG AGTGGGTGGT GGCAATTGGC 
TCCCCGTTTG GACTGGAAAG TACGTTGACC GCCGGTGTGG TCAGTGCAAA AGGCCGTGCC 
TTGCCACAGG AAAATTTTGT GCCTTTCATC CAGACCGATG TTGCCATTAA CCCTGGCAAT 
TCTGGCGGAC CGTTATTCAA CCTCAAGGGT GAGGTGGTAG GCATTAACTC CCAGATATAC 
AGCCGAACTG GCGGTTATAT GGGGTTATCG TTCGCCATTC CGATTGATGT GGCCATGGAT 
GTTGCCAATC AGCTCAAGAT TTCCGGTCGC GTAGCGCGTG GCTGGCTTGG GATCGGTATT 
CAGGAAATGA CCAAGGAGCT GGCTGAGTCG TTTGGTATGA AGAATACCAA AGGGGCTTTG 
GTCGCCGGCG TGGAAAAAGG CAGTCCTGCT GAAAAGGGCG GCCTGGAGCC AGGTGATGTC 
GTAATCAAGT TCGATGGCAA GGATGTCAAT GTTTCTTCCG ATTTGCCGCG TATCGTTGGT 
TCCACCAAGC CTGGCAAGAA GGTGCAGGTC GAAGTCTTGC GCAGGGGGGC TAGCAAGACC 
TTGAATATTA CACTGGGTGA AATGCCGGCC GACAAGGATG AGGTTGTGCC AACTGCGCAG 
CCCGATGCCA AGCCAGAGTC CAATCGCCTG GGGTTGACCC TACGCGAGTT GACGCCACAG 
CAGCGTCGTA GCCTCAATGG TCGCAATGCG CTGGTCGTGG TTGATGCGCA AGGTGCTGCT 
GCACAGGCAG GCATCCGCAG GGGAGATCTG ATCCTAGCCC TGAACAATAC GGAGGTGCAA 
AGCCTGGAGC AGTTCACCAA GCAGGTAAAT GCGGTGCCTG CGGGTAAGAC AGTGGCGTTG 
CTCGTGCAGC GGGAAAACAA TACCCTGTAC GTACCAGTCA AGGTTGGCAA GTAA

Protein sequence

MFKKLIAMSA ICLFVGMAGA TPVLAKELPD FTELAEKQGA AVVNISVTQV VQSGIGGSPF 
PGFPEDEALN EFFRRFGIPG FPGVPRGQGG PQQPEFKSQS LGSGFIISSD GYILTNAHVV 
READEVIVKL NDKREFQAKI VGVDRRTDVA LLKIDATGLP KVTIGNPEQL KVGEWVVAIG 
SPFGLESTLT AGVVSAKGRA LPQENFVPFI QTDVAINPGN SGGPLFNLKG EVVGINSQIY 
SRTGGYMGLS FAIPIDVAMD VANQLKISGR VARGWLGIGI QEMTKELAES FGMKNTKGAL 
VAGVEKGSPA EKGGLEPGDV VIKFDGKDVN VSSDLPRIVG STKPGKKVQV EVLRRGASKT 
LNITLGEMPA DKDEVVPTAQ PDAKPESNRL GLTLRELTPQ QRRSLNGRNA LVVVDAQGAA 
AQAGIRRGDL ILALNNTEVQ SLEQFTKQVN AVPAGKTVAL LVQRENNTLY VPVKVGK