Gene Acid345_2731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2731
Symbol
ID	4069422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3228955
End bp	3230139
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	61%
IMG OID	637984748
Product	lipopolysaccharide biosynthesis
Protein accession	YP_591806
Protein GI	94969758
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3524] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.838486
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.60857
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCGA TTCTGGAGCG TTCGGTCGAG ATCGAGGGAA TTCGCATGGA GGAGCCGGTT 
GATGGGATGC GGCTCATGGT GCGACATCGC AAGCTGGTGG GCGTGGTTGC GGCGATTGCG 
GCAGCGGTCG CGACAGTGGC TGCGATGTTG CTTCCGCCTA CATATACAGC GACGGCGCGT 
CTACTCCCGC CACAGCAATC GCAGTCGCTC GCTGCGCTGT TCGTGGGGCA GACGGGGAAC 
TCCCCGTTAG CGGCGATGGC GCAAAAAGAT CTTGGGTTGA AGAATCCTGC AGATCTTTAC 
ATCGGCGTGT TGAATAGCCG CAGCGTCCAG GACGGATTGA CGAAGCAGTT TGAGTTGGCC 
ACCGTTTATG GATTGAAGCG CCCTTCGGAT GTGCGCGCGC GGCTGGTCGA TCGAACCCGG 
ATTCAGTTGA CGAAGGAAGG ACTGATCAGC GTCTCGGTTG AGGACCGTGA TGCGAACCGC 
GCGGCGGGAC TCGCCAACGG TTACGCGGAA CAACTCCGGC TGGCGACGAA GCGACTGGCG 
ATTTCGGAGG CAGCACAGCG GCGGAAGTTT TTTGATGAAC AAGTGCAGCA GACCCGTGAC 
GAACTTGCGC GGGCAGAAAC GACATTTCGT GAAGTCCAGG AGAAGACCGG CATTCTGCAA 
CTGGATGCGC AGGGGAAAGC GTTGATCGAA ACGGCGGCAA CACTGCGGGC GGAGATCGCG 
GCCGGAGAAG TGCAATTGCG CGCGATGCGC AGCTTTGGAA CGGAGCAGAA TCCGGATGTG 
CGTCAGCAGG AAGCGCAACT CGGTGGCTGG CGAGCGGAAC TGGCGCAACT GGAATCGCGA 
CGGATGGGCG ACGGCTTCAG CAAAGGGCGC GCGCCTGCGG ATGCGCAGGA GTATGTGCAG 
GCCATGCGCG AGGTCAGGTA TCGCGAGGCG ATGCTCGAGA TGCTGCTGCG GCAACTAGAG 
GCAGCAAAGC TGGATGAGGC GAAGGAGGCG ACGATCGTCC AGGTAGTTGA TGTGGCGGTC 
CCGCCAGATG TGCGGACATC GCCGAAACGG GCTGCCGTTG TGGTGTTCAG CACGCTTGGC 
GCTGTGCTGG CGACAGCGGT ATGGCTGCAG CTGCGGCAGC GCTTTCTCAC GGATGTCGCG 
TGGCAAGAAC GCTGGAGTGG GCTGCGCAAG GAGTGGGGAC CATGA

Protein sequence

MRAILERSVE IEGIRMEEPV DGMRLMVRHR KLVGVVAAIA AAVATVAAML LPPTYTATAR 
LLPPQQSQSL AALFVGQTGN SPLAAMAQKD LGLKNPADLY IGVLNSRSVQ DGLTKQFELA 
TVYGLKRPSD VRARLVDRTR IQLTKEGLIS VSVEDRDANR AAGLANGYAE QLRLATKRLA 
ISEAAQRRKF FDEQVQQTRD ELARAETTFR EVQEKTGILQ LDAQGKALIE TAATLRAEIA 
AGEVQLRAMR SFGTEQNPDV RQQEAQLGGW RAELAQLESR RMGDGFSKGR APADAQEYVQ 
AMREVRYREA MLEMLLRQLE AAKLDEAKEA TIVQVVDVAV PPDVRTSPKR AAVVVFSTLG 
AVLATAVWLQ LRQRFLTDVA WQERWSGLRK EWGP