Gene Acid345_4645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4645
Symbol
ID	4070802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5503522
End bp	5504571
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	58%
IMG OID	637986685
Product	TPR repeat-containing protein
Protein accession	YP_593719
Protein GI	94971671
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.656867
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGC AAGCACTAAT CCTATTCTTC GTCGCGCTCG TGCTGGGGAT GGTCCCGGCT 
GCGATGGCGC AAACCGGTAC CGTGAAAGGC TATGTCAAAG ACAAGGGCAC GCCGATCGTG 
GGCGCGCAGG TCTTGTTCGA GAATCTTGAC AACGGCCGCA AGATGACCCT GAAGACCGAC 
AAGGCCGGCA ACTTCTTCAG CATCGGCGTC GCCATCGGTA GCTACAAGAT CACCATCACC 
GCCGACGGCA AAACCATCTG GAACACTGCG AAGTATCCGG TCGGCGGCGG CGACGGCAAT 
CCCGAGTTGA ACATCGACTT GGAGAAGGAA CGCGCCGCAC AGGCAACCGC CAATCCGGCC 
AATGCGGAAG CGGTGAAGAA GGCGGAAGAG AACAAGAAAG AGAATGAGAA GATCGGCAAC 
CTCAACACCA TGTTGAAGGA AGCCCAAGCC GATATGCAGG CCAAGAACTT TGACGCGGCG 
ATCCAGATCA TGGAGAAGGC GACCGCGCAA GACGCAACCC ATGACATCAT CTGGGCCGTT 
CTCGCCGATG CGTATCTCGG CGCGAAAAGA TACCCTGACG CGGTGAAAGC CTACGAAAAG 
GCGATCGCGC TCGATCCCAG CAAAGCGCCC GTGCATAACA ACTATGCGCA GGCACTTGCC 
AAGACAGGAC AGTCGGACAA GGCCATCGCC GAGTACGATG CGGCTGCCAA GCTCGATCCA 
GCCCATGCCG GCTCGTTCTA CTTCAATGAA GGCGCCGTCT TGACCAATGC TGGAAAGACC 
GACGACGCCA ACGCGGCCTT CGATAAAGCG ATCGCTGCCG ATCCCACCAA GGCAGACGCC 
TATTACCAGA AGGGCGTGAA CCTGATGGGC AAGGCGACGC AGAAGGACGG GAAGTATGTT 
GCGGCGCCGG GCACCGTCGA GGCCTTCAAC AAGTACCTCG AACTGTCCCC TGACGGACCG 
AACGCTCAGA ACGCGAAAGA TATGATCGCG GCTCTTGGCG GCACAGTCGT CACCGGCTAC 
AAGGCCGAAA AGGGCAAGAA GAGCAAGTAG

Protein sequence

MRKQALILFF VALVLGMVPA AMAQTGTVKG YVKDKGTPIV GAQVLFENLD NGRKMTLKTD 
KAGNFFSIGV AIGSYKITIT ADGKTIWNTA KYPVGGGDGN PELNIDLEKE RAAQATANPA 
NAEAVKKAEE NKKENEKIGN LNTMLKEAQA DMQAKNFDAA IQIMEKATAQ DATHDIIWAV 
LADAYLGAKR YPDAVKAYEK AIALDPSKAP VHNNYAQALA KTGQSDKAIA EYDAAAKLDP 
AHAGSFYFNE GAVLTNAGKT DDANAAFDKA IAADPTKADA YYQKGVNLMG KATQKDGKYV 
AAPGTVEAFN KYLELSPDGP NAQNAKDMIA ALGGTVVTGY KAEKGKKSK