Gene Anae109_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_2067
Symbol
ID	5373919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2340626
End bp	2342386
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	73%
IMG OID	640843580
Product	TPR repeat-containing protein
Protein accession	YP_001379254
Protein GI	153004929
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0230242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCTT CGAGCTCGAG CACGACAGCG GCCGGGCGCC CCTGGTCGAG GTTCCGCTCC 
GTGGCGATGG CCGCCGCGAT CGCGACGTTC GCGCTGGCCA TCTACGCCGG CGCGCTGCGC 
AACGGGTTCG TGTACGACGA CATCCCACAG GTCGTGCAGA ATCCCTGGAT CCGCGACGCC 
TCGAGCCTCC TCGCGGCGTT CACGTCCGAC GCCTGGGGGT ACCTGGGGAT CCACAGCAAC 
TACTACCGGC CGATGATGCA CGTCGTCTAC GCGGCGGCGA ACGCGCTCTT CGGGCTGGAT 
GCCCGAGGGT TTCACCTCCT CAACCTCCTG CTGCACGCGG CAGTCTCCGT GCTGGTCTAC 
GCCACGTCAC TCCTGGTGCT GCGTGCGGCG CCCGGAGCCT CGCCGGCGCG CTCGCGCGTC 
CTCGCCGCGG CGTCCGGGTT CCTGTTCGCG GCCCACCCGA TCCACACCGA GGTGGTGAGC 
TGGATCTCCG CGACGACCGA TCTCTGCGTC GCCCTGCTCG CGCTGTCCGC GCTGCACGCG 
TACGCCACGC TCCCGCCCGA GCGCGTCCCT TCCGCCTCTC CCCGCTACCT GTGGGCGGTC 
ATCGCGTTCG CGATCGCGAC CCTCACCAAG GAGGTCGCCC TCGTCATCCC GGGGATCCTC 
GTCGCCTGGG ACGTCTCCTT CCGGCGGCAC GCGGTCGTTC GGGTGCGGTG GCTCGCGGCG 
TACGCGCCGT TCGCCGGGGT GATCGGGCTC TACTTCCTGC TGCGCTGGAG CGCGCTGGGG 
GGCTTCGCCT CCATCTCGCG GCATCAGGAG CTGACGACCC TGCAGCTTGC TCTCAACGTC 
TGCGCGCTGT TCGGGGCCTA CCTCGCGAAG CTCGTCGTGC CGTCGGGCCT CTCCGCGTTC 
CACCCCTTCG ACCCGGTGGT GTCGATCGCG GACCCGCGTG CGCTCGCGGG CCTCGTCGCC 
CTGGCGCTGG TGGTGGCGTT CGTCTCGATC GCCTGGCGGA GGAGGAGCGG CGCCGTCCTC 
GTTGCGCTGG CGGTGCTGCT GCTGCCGCTC CTCCCGAGCC TGTGGCTCAC CCGCCTCGGC 
GAGAACCCGT TCGCCGAGCG CTACCTGTAC CTCCCGTCGC TCGGATTCAT CTGGCTCCTC 
GCCATCGCGG GACAGCGGCT CGTCGCGGCC AGGCCCCGTC TCGCGCCTGC GCTCGGCGCC 
GCGGCCGTCG TCCTGTGCGC GACGTGGGCC TGGGGCGTCG CCGCGCGCCA ACCCGCCTGG 
CGCGACGACG TCTCGCTCTG GAGCGACGCG GCCGCGAAGG CGCCCGGCGC CGCGATCCCC 
CGCTACAACC TCGCGGTCGC GCTGGAAGCT GCCGGGGACC TGCCACGCGC GATCGCCGAG 
TACGAGACCG CGCTGCGGCT CGAGGAGAGC CCGGTCGCGT GGACGAGCCT CGGCGCGGCG 
TACCACGCGG CCGGGCGTGA CGAGGACGCC CTCCGCGCCT ATGGACGCGC GCTCTACTGG 
GACGCCGCGA ACGTCACGGC GCTGAACGGC CTCGGCGCGA CGTACGTGAA GATGGGCCGG 
GGCGCGGCGG CGATCGAGCC GCTCCGCGCC GCCATCGGGT TGGCGCCTCG GTTCGCCCCG 
GCGTACCACA ACCTCGGGCT CGCGTACGAG CAGCTGGGCG ATTCGCGGGC TGCGATCGAG 
AGCTACCGCG CCGCGCTGGG CGCGGATCCG TCCAGCGCGG CGTCGTACCA GCGTCTGCGC 
GCGCTCACCG CGAGCCCGTA G

Protein sequence

MIPSSSSTTA AGRPWSRFRS VAMAAAIATF ALAIYAGALR NGFVYDDIPQ VVQNPWIRDA 
SSLLAAFTSD AWGYLGIHSN YYRPMMHVVY AAANALFGLD ARGFHLLNLL LHAAVSVLVY 
ATSLLVLRAA PGASPARSRV LAAASGFLFA AHPIHTEVVS WISATTDLCV ALLALSALHA 
YATLPPERVP SASPRYLWAV IAFAIATLTK EVALVIPGIL VAWDVSFRRH AVVRVRWLAA 
YAPFAGVIGL YFLLRWSALG GFASISRHQE LTTLQLALNV CALFGAYLAK LVVPSGLSAF 
HPFDPVVSIA DPRALAGLVA LALVVAFVSI AWRRRSGAVL VALAVLLLPL LPSLWLTRLG 
ENPFAERYLY LPSLGFIWLL AIAGQRLVAA RPRLAPALGA AAVVLCATWA WGVAARQPAW 
RDDVSLWSDA AAKAPGAAIP RYNLAVALEA AGDLPRAIAE YETALRLEES PVAWTSLGAA 
YHAAGRDEDA LRAYGRALYW DAANVTALNG LGATYVKMGR GAAAIEPLRA AIGLAPRFAP 
AYHNLGLAYE QLGDSRAAIE SYRAALGADP SSAASYQRLR ALTASP