Gene Acid345_1575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1575
Symbol
ID	4069013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1923577
End bp	1924788
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	58%
IMG OID	637983584
Product	type II secretion system protein
Protein accession	YP_590651
Protein GI	94968603
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.377421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0567328
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAAT ACGTCGTAAA GCTGGCCGAC GAACGCGGCC GCATCCAGGA AAAAACCGAG 
AGCGCACACT CCGAGGCCGA GATCCGGGAC CGCTTTTCGC AGGCCGGATA CCTGGTGTAC 
TCGGTCAAGG CGAGGGGTAC AGCCGTTGGC ATCCGCCTGC CGTTCCGCCG CAAGGTGAGC 
GCGCAACAGT TCCTAATCTT CAACCAGCAA TTCCTGACAT TAGTTCGCGC CGGACTGCCG 
ATTGTGCAGT CGATGGAACT CCTGATGCGC CGGCAGAAGA ACCAGTACTT TCAAAAGGTT 
CTTGAAGACG TTCGGGATCG GCTGAAGGGC GGCTCGTTGT TGTCGGAGGC GTTCGAGGCG 
CAGGGAATTT TCCCGAAGAT CTATACGACG ACTCTGCTCG CCGGCGAGAA GAGCGGCAAC 
CTCGAAGAAG TAGTTGGCCG TTACATTGCG TTCCAGCGTC TACTGCTTTC ATTCCGTAAG 
AAGCTGATTG CATCGCTGAT CTATCCATCC ATTCTCGTCT GCGGCGTGGT GGTGCTGTTC 
TCCATGCTGA TTACGTGGGT GGTTCCTCGA TTCGCATTGT TATTCCAGGA TTTAGGTTCG 
GACTTGCCGG CGATCACGAA GTTCGTTCTG GCGTTTGGTA ATAACGCGCA GACTTGGGCA 
CCGTTCGTCC TGGTCGGCGC AATTGTGTTG GCGATCGTTT TTTTTCGTTG GAAGAAAACC 
GAGTCCGGTT CGCTGATGTG GGACCGGTTC ATGATGTCGC TACCGATTTT CGGACAGATT 
TGGCTGAAGT CGCAGGTGTC GACATTCTCG CGCATGTTGT CCACGTTGCT CGGCGGCGGC 
CTGCCGTTAG TGCCGTCGTT AGAGACGGCG GCGGCTTCGA TTGGAAGCAA AACTTTGGCC 
CGGGGGATTC GTACGGCGAG CAAGAGCGTG CGTGAGGGCA GATCGCTGGC CCGGAGCCTG 
GAAGCGACGG CAGCGTTTCC GGATTTGTCG GTAGAGATGA TTGAAGTGGG CGAGTCCACG 
GGCGCGTTGC CGCAAATGCT GGTGTCGGTG GCGGAGTTCT ACGAAGAAGA CGTGCAGAAC 
GCGCTGGCGG CGGCGATGTC GCTGGTGGAG CCGGTAATCC TGATCATCAT GGGCATGGTC 
GTGGGGTTCA TCCTGATAGC ACTCTATCTG CCGATTTTCA GCATCGGAAT GGGCGGGGCT 
GCGGGACACT AG

Protein sequence

MAEYVVKLAD ERGRIQEKTE SAHSEAEIRD RFSQAGYLVY SVKARGTAVG IRLPFRRKVS 
AQQFLIFNQQ FLTLVRAGLP IVQSMELLMR RQKNQYFQKV LEDVRDRLKG GSLLSEAFEA 
QGIFPKIYTT TLLAGEKSGN LEEVVGRYIA FQRLLLSFRK KLIASLIYPS ILVCGVVVLF 
SMLITWVVPR FALLFQDLGS DLPAITKFVL AFGNNAQTWA PFVLVGAIVL AIVFFRWKKT 
ESGSLMWDRF MMSLPIFGQI WLKSQVSTFS RMLSTLLGGG LPLVPSLETA AASIGSKTLA 
RGIRTASKSV REGRSLARSL EATAAFPDLS VEMIEVGEST GALPQMLVSV AEFYEEDVQN 
ALAAAMSLVE PVILIIMGMV VGFILIALYL PIFSIGMGGA AGH