Gene Acid345_1390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1390
Symbol
ID	4068925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1686925
End bp	1688139
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	59%
IMG OID	637983399
Product	type II secretion system protein
Protein accession	YP_590466
Protein GI	94968418
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.387943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0225351
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTAT TTACATTCAC TGGCAAGAAC GCCACCGGCG AGAAAGTCAC CGGCGAGCGT 
GTCGCCGAAA ACAAGCAGGC CCTGGCCAGC AATCTGCGGC GTGAACGAAT CCAGCCCGTC 
ACCATCAAGG AGAAGGGCAA AGAATTCGTC ATGCCGACAT TTGGCGGCGG CAGCGTCAAG 
ACCAAGGACA TCGCCATTTT CTTCCGGCAG TTCTCGGTCA TGATTGATGC CGGCCTCCCG 
CTGGTGCAGT GTCTTGAGAT TCTCGCGGGC AACCAGGAAT CTCAAGCCTT CCAGAAGGCG 
CTTAACGGCG TCCGGACAAC TGTGGAAGGC GGCTCGACCC TGGGCAACGC CATGCGTGGC 
TACCCCAAGA TTTTCGACGA CCTTATGGTC AACATGGTGG ACGCCGGCGA AACCGGCGGT 
ATTCTCGACA CCATTCTTCA GCGTCTCGCG ACCTATGTAG AAAAGGCCGT GAAACTGAAG 
GCGGCCGTCC GCTCGGCGTT GATCTACCCG GTCTCGGTCA TCACGATTGC GGTTTTGATC 
GTCGGCCTGC TGCTGTGGAA GGTCGTCCCG ATTTTCGCCA ACCTCTTCGT TGGCCTCGGT 
GCTCCCCTTC CCCTGCCTAC GCGAATCGTC ATCGGCATCA GTAACTTCCT CGGAAGTTTC 
TGGTGGATGG TGCCGATCAT GGTAGCTGCC GTGTTCTTCG GAGTCCGTGC ATTGCGCTCC 
GACCCGCGTG GCCGCTACTT GACCGACAAT TTTCTGCTCC ACATTCCGAT TATCGGCATG 
CTGCTGCGTA AGATCGCCGT CGCCCGCTTC ACCCGTACCC TGGGCACGCT GATCACCTCC 
GGCGTTCCGA TTCTCGAAGG CTTGAACATC ACCGCCCGCA CCTCCGGTAA CCGCGTGGTG 
GAAGAAGCGC TCTACAAGGT CCGCAAGTCG ATCGAAGAAG GCCGCACCAT CGTCGATCCG 
CTTCGCGAAT CCGCTGTCTT CCCCAACATG GTTACGCAGA TGATCGGCGT CGGTGAGGCC 
ACCGGTGCAA TGGATGCCAT GCTCCAGAAG ATCGCGGACT TCTACGAAGA CGAAGTGGAC 
GCCGCGACCA AGGACTTGCT GACGTTGCTC GAACCCATCA TGATCGTGTT GCTCGGCATC 
ATGATCGGCG GCGTAGTCGT TTCGTTGTAC CTGCCGCTCT TCTCGATGGT GGCGAAGCTC 
TCCGGCGGCG GTTAA

Protein sequence

MPVFTFTGKN ATGEKVTGER VAENKQALAS NLRRERIQPV TIKEKGKEFV MPTFGGGSVK 
TKDIAIFFRQ FSVMIDAGLP LVQCLEILAG NQESQAFQKA LNGVRTTVEG GSTLGNAMRG 
YPKIFDDLMV NMVDAGETGG ILDTILQRLA TYVEKAVKLK AAVRSALIYP VSVITIAVLI 
VGLLLWKVVP IFANLFVGLG APLPLPTRIV IGISNFLGSF WWMVPIMVAA VFFGVRALRS 
DPRGRYLTDN FLLHIPIIGM LLRKIAVARF TRTLGTLITS GVPILEGLNI TARTSGNRVV 
EEALYKVRKS IEEGRTIVDP LRESAVFPNM VTQMIGVGEA TGAMDAMLQK IADFYEDEVD 
AATKDLLTLL EPIMIVLLGI MIGGVVVSLY LPLFSMVAKL SGGG