Gene Acid345_3941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3941
Symbol
ID	4071324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4662323
End bp	4663300
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	57%
IMG OID	637985967
Product	TPR repeat-containing protein
Protein accession	YP_593015
Protein GI	94970967
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.652305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCCA TTTACCTAGG TGTTCTTTTC ATCGCAGCGT TTGCGATGCA ACTTGCGGCC 
CAAGCTCCGG CGAGCATCCC GAAGGTGACA GACCTCTCCG TGCGCGTGGT TTTCGAGAAC 
GGGCGTTCCG CTGGACCTAA CAATCGCGTC GAGGTATTGG GCCAGTACGG AGGCAGCGTG 
ACCTCTGGAT CTACGGATAC GTCGGGCCAG GTGACGTTTC CAAGGATGGA CCCGGGCAAC 
TACAGATTGC GAGTGTCGGG ACCCGGAATC GTGACGACGG AAACACCTGT CATTGACCTC 
ACTGATGCAG GCCCGCGCTC CAACCAAACG GTGCCGGTGA AGCCGTCCGG CCAGATGGGC 
GATTCGGCGC CGGGAGCGAC TGTGGACGCG AATATCCCAG CGGATGCTAG GAAAGAATTC 
GATAAGGGCG AGGACAAGTC GCAAGGGAAA GATTACAACG CTGCGCGGGA GCATTTGGAA 
AAAGCAGTCA CGATCTATCC CAAGTATGCG ATGGCCTACA ACGACCTGGG TTTGGTGTAC 
ATGCACTTAA ACCAGGGCCC CAAGGCGGTG GAGGCGTTCA AGACGGCGGC GCAGTTGGAT 
GAACATTTGA AACAGGCGAA CCTGTTTCTC GGCCAGTTCT ATTACGAGAA CCACCAGTTC 
AAGGACGCCG AGCCGTATCT GGTTCATGCC ACCAAAGACG ATCCGAAGAA CGCACAGCTG 
CTGCTGGCTC TTGCGAACAG CCAATTAAGG AATGGGCAGA ACGACGAAGC ACTCGCGACC 
GCGCAGAAAG TGCATGCGTT GCCTGACCAT AAGAAATTCG CTGCAGCGCA TCTGATCGCT 
GCCGAGGTAT ATGCCGACAA GGGCGACAAT CAGCACGCGA AAGACGAGTA TCACGTTTTC 
CTGAAAGAAG ATTCCAACTC GCCGATGGCC CCCAAGGTGA AAGAAGCCCT GGCGAAATTG 
GAAGCCCCGG CGAAGTAG

Protein sequence

MKPIYLGVLF IAAFAMQLAA QAPASIPKVT DLSVRVVFEN GRSAGPNNRV EVLGQYGGSV 
TSGSTDTSGQ VTFPRMDPGN YRLRVSGPGI VTTETPVIDL TDAGPRSNQT VPVKPSGQMG 
DSAPGATVDA NIPADARKEF DKGEDKSQGK DYNAAREHLE KAVTIYPKYA MAYNDLGLVY 
MHLNQGPKAV EAFKTAAQLD EHLKQANLFL GQFYYENHQF KDAEPYLVHA TKDDPKNAQL 
LLALANSQLR NGQNDEALAT AQKVHALPDH KKFAAAHLIA AEVYADKGDN QHAKDEYHVF 
LKEDSNSPMA PKVKEALAKL EAPAK