Gene Acid345_2587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2587
Symbol
ID	4070550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	3055969
End bp	3057198
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	60%
IMG OID	637984604
Product	O-antigen polymerase
Protein accession	YP_591662
Protein GI	94969614
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGATC TTCGCCGCTC GGCCCTCGCC ATCTTCTTTT TCGGCGCACT TCTGCTCTCC 
TCCGGCGCAT TCGCCCCACT CTGGACAGAC ACTGCCGCAC ACGACGTCGC CGAAGGTGGC 
GTCGCTCTCC AGATAATTTG GTCCGCCATC TACCTCTTTG CCGCGGCACT CCTCCTTCCG 
CGATACAAGC AAGCTGCCCA CATACTCGCC GCGAATTGGC TGCTATTTCT GCTCATCGCA 
CTTTGCGCGG TATCTGCGCT CTGGTCGCCG AATGTCGCCG TAACCCTGCG CAAGAGCGTC 
GCAATCACCG GCACAACTTT GCTGGGCGTA TGCTTCGCTC TCGAGTTCGA CATGCGCTCG 
CAACTCCGCA TTCTCGTTGC GGTCATCTCC GTGGCGGCCG TCGCAAGCCT CCTGGCGGAA 
CTCTTCTACC CGGCAAGCTT CCCCGCCACC GAATTCGCCG GGGCCGCTTG GCACGGCGTC 
TTCTCGCACA AGAACCTGCT CGGACGCACC ATGTCCCTCG GCGTCGTGAC CTTCCTCTGC 
TTCGGCTTCA AACGCCTCGG ATCCATCCTC ACCGCGTCGA TCGGAGTGCT CGCGTGCGTC 
TCAATGATTG TCGCGGCCCG TTCGCAAACG GCGCTGGTTG TCGCACTCGC AATACCGCTC 
CTGATCGGGA TTTCCGGCAT ACTTCGCGCC GATTGGCGTC GCGCCTGGGC TGGCTCTATG 
CTCGCGCTCA CCTTCTTCGC ACCCGTGGCA GCGTACGCAA TATCTCATCG CGACTCTGCC 
GTCGCACTTC TCGGTCGCGA TGCGACCTTC ACCGGCCGTT CGCAGATTTG GGATCTCACA 
GCACCAGCGT TCACGTCTCA TTTCTGGCTC GGCCATGGTT ATGGCGCGTT CTGGTGGATC 
TCCTCTGACT CGATACAAAT CATCTCCGAG CTTGGTTATG ACACTCCCAA CGCTCACAAC 
GCATTCCTCG ATCTCGGACT ACAGGTCGGC GTGATCGGGA TCGTTCTTTT TTTCGCCGGT 
TGGCTCGTGT CGCTCTTCGG TGCCGGACGC CTCGTCAGAA AGTCCTCCGC AGTCGAGTCC 
CGCTGGCCGC TGCTCTACCT GCTATTTCTG CTGCTCTACA GCTTCACCGA AAGTTCGTTG 
TTGGCACCCA ACTCTCTGCT TTGGATCCTC TATTCCGCGG CATGCTTCAC AGTCTCAAAC 
TCGAATCAGG CCCAGCACCA GGCCGCATGA

Protein sequence

MNDLRRSALA IFFFGALLLS SGAFAPLWTD TAAHDVAEGG VALQIIWSAI YLFAAALLLP 
RYKQAAHILA ANWLLFLLIA LCAVSALWSP NVAVTLRKSV AITGTTLLGV CFALEFDMRS 
QLRILVAVIS VAAVASLLAE LFYPASFPAT EFAGAAWHGV FSHKNLLGRT MSLGVVTFLC 
FGFKRLGSIL TASIGVLACV SMIVAARSQT ALVVALAIPL LIGISGILRA DWRRAWAGSM 
LALTFFAPVA AYAISHRDSA VALLGRDATF TGRSQIWDLT APAFTSHFWL GHGYGAFWWI 
SSDSIQIISE LGYDTPNAHN AFLDLGLQVG VIGIVLFFAG WLVSLFGAGR LVRKSSAVES 
RWPLLYLLFL LLYSFTESSL LAPNSLLWIL YSAACFTVSN SNQAQHQAA