Gene Acid345_1391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1391
Symbol
ID	4068926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1688187
End bp	1689314
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	59%
IMG OID	637983400
Product	twitching motility protein
Protein accession	YP_590467
Protein GI	94968419
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2805] Tfp pilus assembly protein, pilus retraction ATPase PilT
TIGRFAM ID	[TIGR01420] pilus retraction protein PilT

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.899661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0234159
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTTA CTCTTAGCGA TCTGTTGAAA AAGATGTTGG AGATGCAGGG CTCTGACCTG 
CACATCACCA CGAACTCGCC GCCGCAAGTG CGGGTTCACG GCAAACTGGT TCCCCTCGAC 
CTGGCGCCGC TAACTCCTGC CGAAACGAAG CAGCTGGCCT ATAGCGTCAT GACTGACGCC 
CAGAAGCACC GTTTCGAAGA GGACCTCGAG CTAGATTTCT CGTTCGGATT GAAGGGACTC 
GCCCGTTTCC GCGCCAACTG CTTCAACCAG CGCGGCGCGT GCGGCTCCGT TTACCGCGTC 
ATTCCATTCG AGATCAAGAA CTTCGACCAG CTCGGACTGC CCGCAGTCGT TTCCAAGCTC 
TGCGATCGTC CGCGCGGCCT GATCCTCATC ACTGGCCCGA CCGGTTCCGG TAAGTCCACC 
ACGCTCGCGG CCATGATCGA CAAGATCAAT ATTGACCGTC ACGAGCACAT CATCACCATC 
GAAGATCCGA TCGAGTTCGT GCACCAGCAC AAGAACTGCC TGATCAACCA GCGCGAAGTC 
CACTCCGATA CCAAGGGCTT CTCGCAGGCG CTCCGCGCCG CTCTCCGTGA AGACCCCGAC 
GTGGTCCTGA TCGGCGAAAT GCGCGATTTG GAGACGATTG AATCCGCGTT ACGTATTGCA 
GAAACCGGCC ACTTGACGCT GGCTACCCTG CATACCAACT CGGCAAGCTC CACCATCAAC 
CGTATTATTG ACGTCTTCCC TTCGCACCAG CAGTCGCAGA TTCGCGCGCA GCTCTCGCTG 
GTGCTGGAAG GCATCATGTG CCAATCGTTG TTGCCGAAGG TCGGCGGTAA CGGTCGCGCC 
ATGGCCATGG AGATCCTGGT TCCGAACGCC GCTGTCCGCA ACCTCATCCG CGAAGACAAG 
ATCCACCAGA TCTATTCGTC GATGCAGACC GGCCAGGACA AGTTCGGCAT GCAGACCTTC 
AACCAGGCGC TGGCAACGCT GGTCGCCCAG AAACAGATCA CGATGGAACT CGCCGTGCAG 
CGCTCGTCGA TGCCGGAAGA GTTGCAGGAC ATGATCGCCC GTGGACACAC CCTGCAAGGT 
CGAGGGGGCA CCACAGCCGT TAATGCCGCC GCACCAACGC GGAGATAG

Protein sequence

MAVTLSDLLK KMLEMQGSDL HITTNSPPQV RVHGKLVPLD LAPLTPAETK QLAYSVMTDA 
QKHRFEEDLE LDFSFGLKGL ARFRANCFNQ RGACGSVYRV IPFEIKNFDQ LGLPAVVSKL 
CDRPRGLILI TGPTGSGKST TLAAMIDKIN IDRHEHIITI EDPIEFVHQH KNCLINQREV 
HSDTKGFSQA LRAALREDPD VVLIGEMRDL ETIESALRIA ETGHLTLATL HTNSASSTIN 
RIIDVFPSHQ QSQIRAQLSL VLEGIMCQSL LPKVGGNGRA MAMEILVPNA AVRNLIREDK 
IHQIYSSMQT GQDKFGMQTF NQALATLVAQ KQITMELAVQ RSSMPEELQD MIARGHTLQG 
RGGTTAVNAA APTRR