Gene Msil_2322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2322
Symbol
ID	7090306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2517000
End bp	2519807
Gene Length	2808 bp
Protein Length	935 aa
Translation table	11
GC content	62%
IMG OID	643465645
Product	TPR repeat-containing protein
Protein accession	YP_002362615
Protein GI	217978468
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0205826
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTGC CAAAATATGA AAGCGCGGCT GTTTCGGGTC AAGGCCATAG TCGCGACAAA 
GCGCTGCTGC AGGTCGCGAT TACGCGGGCG TTCGCCTTTC TGAATTCCGG CCAACCGGAC 
GAGGCGCTGG CGGAGCTCGG CGGACACGCC CAGCGGGCGG CGCGGAGCGA TCTCGCCTGT 
TATGTCTTCG GGCTGATTTG CTTCAACGCC GGGGATCTGC GCGAGGCGCT GATCTGGTTC 
GAGCGCGCGC TCGCCTTGAA GCCCGATTAT TTCGAGGTGC TCAGCGCGCG CGCCATCGTG 
CTGCAAAGAC TCGGCCAGCC CGAGGATGCG CTCGAGGCTT TTGAGGACAT CCTGAAACTG 
CGCCCGAACG ACGCCGACGC GCTGTTCAGC ATCGGCGTCA TTTTACAGAG TCTTGGCCGC 
ATGAACGAAG CGCTCGTCTC CTATGAAGGC GCTTTGCGGG CGCAGCCCAA GCATTGCGAG 
GCGTTGACCA ATCGCGGCGC TCTGCTCGAA CGATTTGGCC GTCTTACTGA GGCGCTGTCC 
TGTTTCGAAG CGATCATCGC GCTGCGCCCC AACAATGGCG GAGCCCTCTT CAACAAGGGC 
TCGGTGCTGC AAAAGCTCGG CCGCAACGAA GACGCGCTCG CCGCCTATGA GGCGGCGGCG 
CAATCCGGGC CGCCCGATCC CGAGACCGAG CTCAATCGCG GCAATGTGTT GCAAAAACTC 
GGACGGCTCG ATGAAGCGAT CGTCTGCTAC GACCGCGCAG CGCGCCGGCC TGGGGGTTAT 
CCGCAGGCGC TCTACAACAA GGGCATTGCT TTGCAGGCGC TGGGCCGGCG GTCGGCCGCC 
CTTGCCGCTT ATGACGCGGC TCTCGTGCTC GACCCCCGCT ACTGCGAGGC GATCTGCAAT 
CGCGGCAATC TGTTGCATGA ACTCGGCCGG CTCGAGGACG CCTATATGGC CTATGCCGCG 
GCGCTGAAAA TCAGGCCCGC GTTCCTGCCG GCGCTGACCA ACCGCGCCAA TATCTGCCTG 
CAATGGGGCC GCCTCGACGA AGCGATCCGC CATTGCGACG AGGCGTTGCG GCATGATCCA 
AAATACCCGC AGGCGTTGGG CTTGCGCGGC GCGGCGCTGC ACCGCCTTGG GCGGCTCGAG 
GAGGCGCTCG TTTCGCTCGA CCTTGCCGTG TCCGTCCGAC CGGCCGCGCC GGAGGCCTGG 
CTCAATCGCG GCAACGTCTT GCAGGAGATG GACCGGCTCG CCGACGCCGT CGCCTCCTAC 
CATGAGGCGC TCCGGCTTTC CCCTCATTAT CCGGAGGCGC TGTCAAGCCT TGGCGTCGCT 
CTGAAGGAAC AGGGGGATGT CGACGAAGCG CTTGCATGTT TCAACGAGGC CATACACTAC 
AAGCCAGACT ATCCAGATGC GCGCAACAAC AGGGCCGGAG CGCTGTTGCT GATGGGGAGG 
CTGAAAGAAG GTTTTCGCGA CTTTGAAAGT CGTTGGGATC GATCCAACGC GCCGCCGAGA 
CCCATCATTC CCGCGGCGGC CCGGTGGACC GGCGAGGATC TGACGGGCAA AAAAATTCTC 
GTTTACGATG AACAGGGGCT TGGCGATCTC ATCCAGTTCT GCCGCTACAT TCCCTTGCTT 
GAGGAGCGCG GGGCTGAAGT CACCCTGTTG TGCCGCAGGA CCATGCAAAG GCTGCTGCGC 
AGCCTGGATT CCCGCGTTCG GATGATCGAC TCCCTGGACC CTCAAGACCG GTATGATTTT 
GCATCCGCCT TGCTCAGTCT GCCAGGCGGA TTCGGCGCGG AGCTCGAAAC GATTCCGGCG 
CAGACGCCTT ATCTTTTCGC GGAGCCCCAG GCTGTCGCCC AGTGGTCGCA GCGCATCGGC 
CCCGAAGGAT TTCGGATCGG CATATGCTGG CGCGGAAATT CCGCGATCAA TTTGAAGCGC 
GGCTTTTCCC TGGACTGCCT CGGCCCGATC GCCGCGATCG AGGGCGCGCG CCTGATCGGC 
CTGGTCAAGG GCGAAGGGCC GATGGAAATC GAGACGCCGC AGGGATCGGC GCGCATCGAA 
GGGCCGGGGC CCGATTATGA CGCAGGGCCG GACGCCTTTA TCGATTGCGC CGCCGTGATG 
GAATCTCTGG ATCTCGTCAT CACGTCGGAC ACCGCCATAG CCCATCTCGC CGGCGCGCTT 
GGACGGCCTG TGTTCGTCGC CCTGAAACAT GCGCCGGACT GGCGATGGCT GCTGCATCGT 
CTAGATTCGC CATGGTATCC GACGATGCGG TTGTTCCGCC AAAAGGAGCG CGATCAATGG 
CGGCCCGTTT TCGATGAAAT GGCTGCGGCG GTCGGCGCGC TTGTCCGCGG CGTCGGCAAT 
TCTATCCCGC CGCCCGATTT GTCTTCCAGC GATCAGAGCG TCGCGGCAGG ACCGCACGCG 
CTCCAACCTG AAGACCCGCC GGCGCTCATC GCCATACCGG CAGGCGTTGG CGAACTCATC 
GACAAGATCA CAATTCTTGA GATCAAGGAG CGCCGCGTCG ACGATCCGGC CAAGCTGCAC 
AACATACGCT TCGAACTCGC CCTGTTGCGC AAGCTTCGAG ATGAGCACGA TCTGTCGGAC 
CCTGCGCTCG CGCGTCTTGA GGCGGAGTTA AGAAAGGCCA ATGAATCTCT GTGGGATGTC 
GAAGACGCAT TGCGCTCGTG CGAATCGAAG AACAAATTCG ACGAGGAGTT TGTCTCTCTC 
GCGCGACTTG TCTACACCTG CAACGACAAG CGCGCTCATG TGAAGAAAGA GATCAATCTG 
TTGTTCAATT CCGCCATTAT CGAGGAGAAA TCCTACGCCC GCGCGTGA

Protein sequence

MSVPKYESAA VSGQGHSRDK ALLQVAITRA FAFLNSGQPD EALAELGGHA QRAARSDLAC 
YVFGLICFNA GDLREALIWF ERALALKPDY FEVLSARAIV LQRLGQPEDA LEAFEDILKL 
RPNDADALFS IGVILQSLGR MNEALVSYEG ALRAQPKHCE ALTNRGALLE RFGRLTEALS 
CFEAIIALRP NNGGALFNKG SVLQKLGRNE DALAAYEAAA QSGPPDPETE LNRGNVLQKL 
GRLDEAIVCY DRAARRPGGY PQALYNKGIA LQALGRRSAA LAAYDAALVL DPRYCEAICN 
RGNLLHELGR LEDAYMAYAA ALKIRPAFLP ALTNRANICL QWGRLDEAIR HCDEALRHDP 
KYPQALGLRG AALHRLGRLE EALVSLDLAV SVRPAAPEAW LNRGNVLQEM DRLADAVASY 
HEALRLSPHY PEALSSLGVA LKEQGDVDEA LACFNEAIHY KPDYPDARNN RAGALLLMGR 
LKEGFRDFES RWDRSNAPPR PIIPAAARWT GEDLTGKKIL VYDEQGLGDL IQFCRYIPLL 
EERGAEVTLL CRRTMQRLLR SLDSRVRMID SLDPQDRYDF ASALLSLPGG FGAELETIPA 
QTPYLFAEPQ AVAQWSQRIG PEGFRIGICW RGNSAINLKR GFSLDCLGPI AAIEGARLIG 
LVKGEGPMEI ETPQGSARIE GPGPDYDAGP DAFIDCAAVM ESLDLVITSD TAIAHLAGAL 
GRPVFVALKH APDWRWLLHR LDSPWYPTMR LFRQKERDQW RPVFDEMAAA VGALVRGVGN 
SIPPPDLSSS DQSVAAGPHA LQPEDPPALI AIPAGVGELI DKITILEIKE RRVDDPAKLH 
NIRFELALLR KLRDEHDLSD PALARLEAEL RKANESLWDV EDALRSCESK NKFDEEFVSL 
ARLVYTCNDK RAHVKKEINL LFNSAIIEEK SYARA