Gene Acid345_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0689
Symbol
ID	4071334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	847883
End bp	849058
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	58%
IMG OID	637982695
Product	twitching motility protein
Protein accession	YP_589768
Protein GI	94967720
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2805] Tfp pilus assembly protein, pilus retraction ATPase PilT
TIGRFAM ID	[TIGR01420] pilus retraction protein PilT

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCCT CTGAACCAGC GCTTTCGTCC GCACCTTCGC CATCGCCTAC GCCGGTGTTT 
ACCACCGATG AGATGCTCAG AACCATGCTG AAAGTCTCTG AAAAGGTCAG CGACCTGATC 
TTCTCGCCCG GGCGTGCTCC GCAGGTGGAA CTGAACAGCG CTCTCGTCGC GGTGCCAGGA 
TTGCCGACAT TAATGCCCGT GGACACACGG CGAATCGCCG GCGATTTGAT GGGTAATAAC 
GAACAAGCGA CAACTTCGTT GAGGGAGAAG GGTTCGGCCG ATCTCTCCTA TAGCCTTGCG 
CGTGAATCGC GATTCCGTGT GAACATCTTT TCGCAGCGCG GCAGTTACGC CATCGTGATG 
CGCGTCATCC CGCACAGCGT GCCCACATTC GAGCAGTTGA ACCTGCCGCC ACAACTGGCC 
GACATTACCA AGCTGATCAA CGGCATCGTC CTGGTCACGG GCCCCACCGG ATCAGGTAAG 
AGTTCCACCC TGGCGGCGAT CATCAACAAG GTCAACTTGG AGAAGGCGTG GCACATCGTC 
ACCATTGAGG ATCCGATCGA GTTTCTTCAC CCTCATAAGC AGTGCACCAT TCACCAACGA 
GAGTTGCATA GCGACACGCC GAGCTTTGCC CTCGCTCTGC GCGCTGCGCT GCGCCAGGCG 
CCAAAGGTCA TCCTGGTCGG CGAAATGCGC GATCGTGAAA CCATGGAGAT TGCACTCGAA 
GCCGCGGAAA CCGGCCACCT CGTCATGTCA ACTCTCCACA CCACCGACGC CTCCAAAACC 
GTGGAGCGCA TCATCGGCAC CTTCCCGATT TCCGACCAGC ACATTATTCG AATCCGCTTA 
GCGAAGAGTT TCCGCTACAT CATTTCGCAG CGTCTTATGC CGAAGAAGGA TAAGACCGGA 
CGCGTGGCTG CCATCGAGAT TCTCAAGTCC ACCATCCGCA CTCGCGAGTA CGTAGAGAAA 
GGCGAGAACG AAGGCAAGAC CTTGCTCGAC GCCATGCGCG ATGGCGACCT CGACGGCATG 
CAGTGTTTCG ACGACGTGAT CGAGCGCATG ATCCGCGAAG GTGTGGTCGA CATTGATACT 
GGCCTCGGAT ACTCCACCAA CCCCGGCAAC CTGCGCCTCC AGTTGGCGGA CCTGATTGAT 
GCTCAGCGCG CCGCGGAATC TGAATTCGAA CCATAA

Protein sequence

MSASEPALSS APSPSPTPVF TTDEMLRTML KVSEKVSDLI FSPGRAPQVE LNSALVAVPG 
LPTLMPVDTR RIAGDLMGNN EQATTSLREK GSADLSYSLA RESRFRVNIF SQRGSYAIVM 
RVIPHSVPTF EQLNLPPQLA DITKLINGIV LVTGPTGSGK SSTLAAIINK VNLEKAWHIV 
TIEDPIEFLH PHKQCTIHQR ELHSDTPSFA LALRAALRQA PKVILVGEMR DRETMEIALE 
AAETGHLVMS TLHTTDASKT VERIIGTFPI SDQHIIRIRL AKSFRYIISQ RLMPKKDKTG 
RVAAIEILKS TIRTREYVEK GENEGKTLLD AMRDGDLDGM QCFDDVIERM IREGVVDIDT 
GLGYSTNPGN LRLQLADLID AQRAAESEFE P