Gene Acid345_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3803
Symbol
ID	4071087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4494071
End bp	4495105
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	56%
IMG OID	637985826
Product	polysaccharide export protein
Protein accession	YP_592877
Protein GI	94970829
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAGGA AGATTTTTTT AGTCTCCCGC AATCTGCTTT TGATCGCCAG CAGCGTGCCT 
GCCACGATGT ATGGGCAAGC CTCGAATCAG CAGCAGCTCC AGCAACAGTT GTTACAACTT 
CAAATGCGCA GTGCTGGATC ACCGATGGGA TCTGCGCAAG GCGGACCGGG GAATACCATG 
CGCTCGGGTG CTGTGGTTGC GCCAGAGGAC GTTTCCAAAT TGAAGTTGGC GCCGGGCAGC 
ATGATCGAGG TCCACGTATT CGAGGAACCT GATCTTGATG GGACCTATCG GCTCGATACC 
ACGGGCCAGG TGAAACTTCC TCTCGCCGGC GACGTGCTCG TGAAGGAAAT GACGTTGCGT 
GAAGCGGAAG TCGCGATCCG GACCAGGCTA GTTTCCGAAG AAATTTTGAA GGACCCGCAT 
GTGGTTGTGA ACGTCGCGGA GTACAGCACG CAAAATATCG TCGTGCTCGG CGAGGTTGGT 
GCGCCCGGAC GGTACCCAGT GATCGGTTCC CGTACGCTGC TCGACGTTTT GGCGATGGCT 
GGTGGCCAAA CCGCAATGGC AGGTAACGAG ATTCTCGTCC ACCGGGACGG TACTCCCGCG 
GACAAAATTG AGAAGATCCA CTTTTCGCGA CGGAATGATG ATCCGACCGC GCTTGCATCT 
ACGATCAATC CAGGCGATAC GCTCGTTATT CGCAAGGCCG GAATCGTTTA TGTCCTGGGC 
TCGGTCAATC GTCCCGGCGG ATATGTGATG CAGGAAGCAG GCGACTTGAC CGTCAATCAA 
GCGATCGCGT TGGCATTAGG AACTGCACCG GGCGCCGACA CGGGAAAAGT TCGCGTGGTT 
CGTAAGAACG CTGATGGGAG CATGTCGGAG ATTCGGGCTC AGTATGACGA AGCCAACAAG 
GGCCAGGTAT TTCCATTCGA GTTGCAGCCA GAGGACGTTG TCTACGTTCC GGCAAACTGG 
CTGAAGACGA CGTTCTTGAA CACCCGGCAA TTCATGGGTC AAGTTGCCTC GGCAACGATC 
TACGCGGTGC AGTAG

Protein sequence

MLRKIFLVSR NLLLIASSVP ATMYGQASNQ QQLQQQLLQL QMRSAGSPMG SAQGGPGNTM 
RSGAVVAPED VSKLKLAPGS MIEVHVFEEP DLDGTYRLDT TGQVKLPLAG DVLVKEMTLR 
EAEVAIRTRL VSEEILKDPH VVVNVAEYST QNIVVLGEVG APGRYPVIGS RTLLDVLAMA 
GGQTAMAGNE ILVHRDGTPA DKIEKIHFSR RNDDPTALAS TINPGDTLVI RKAGIVYVLG 
SVNRPGGYVM QEAGDLTVNQ AIALALGTAP GADTGKVRVV RKNADGSMSE IRAQYDEANK 
GQVFPFELQP EDVVYVPANW LKTTFLNTRQ FMGQVASATI YAVQ