Gene Acid345_0725 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0725
Symbol
ID	4069797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	888152
End bp	889981
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	57%
IMG OID	637982731
Product	glycosyl transferase family protein
Protein accession	YP_589804
Protein GI	94967756
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCTA GTACGACTCC GGCCCAACCT GTTGTTGTGG GCCGCTCGCA ATCTTCTAAA 
GCCAAGCTGC ACATCGTGAT CATCAGCCTC TTCTGGCTGG TCATTTACAT CCCGGGCCTC 
TTCACGCCTG CGCTCCTCGA CGACGCCGAC TCCATCCACG CCGAAGCTGC ACGCGAAATG 
ATCACGCGCC ACGACTGGAC CACGCTCTAC ATCGATGGCC TGCGCTATCT CGAAAAAGCC 
CCACTGATGT ACTGGGGAAT GGCCAGCAGC TTCAAGATGT TTGGGGTCAC CGAATGGACC 
GCCCGACTGC CTCTCACGCT CGGCGTCCTC GCAACCCTGC TCGCCACGTA TGCCATCGGC 
AAGCGTAACC TCGGCGAACG CGCGGGATTC TGGGCCGCCA TCATCCTCGG GACGGGCGTC 
GGAACTTATA TCTTCACGCG CATTCTCATC CCCGATCTAC TGGTTGGTCT CTTCCTCACC 
ATCGGCTTTG ATTTCTTTTT GCGCGGGATT GATCAGGAAA AGCCTTCTAT AGCCTCGGCT 
GCCGGCCTCG CCGCTGCTGC CGCGCTGAAT ATCCTGACGA AGGGCTTCAT CGGCGTCATC 
TTCCCCATTG GGATCATCGT TGTCTATCTG TTCCTAACGC ACAACCTGAA GCACCTGCTG 
AAAATGCGCT GGCTGCTGAT GATTGGCGTG CTGCTGGTGA TTGCCGCGCC GTGGCACATC 
CTGGCGAGTC TGGCGAATCC ACCACAGGGA CAGGCGCGCG GCTTCTTCTG GTGGTACTTC 
ATCAACGAGC ACATCCTGCG CTACCTCGGA AAGCGTGTCC CGAAGGACTA CGACACGGTT 
CCGTTGGCGA TCTTCTGGTC GCTGATGGTG CTGTGGCTGT TGCCGTGGTG TGCTTTCGCG 
CTTCAGGCCA TTGCGCGTGT ACCGCGCAAA CTACGTGAAC TCGACCGCCG CGGACGCGCG 
CTGGTGCTTT TCACCATCTG GATGGTGTTG ATCCTCTTTT TCTTCAGCTT CTCCACACGC 
CAGGAGTACT ACACGATTCC GGCGCTGCCG GCCCTGGCTC TGATCACTGC GGACTGGCTC 
GTAGCTGAGG ACGAGTCGCC GGAGAAGAGT TCGCTTCGCA AGTGGGGGAT GATCGGCTCC 
GGATTCCTGC TGTTTCTTGG CATCGCGTTT GCCGGCACTG CGTCATACAT TCTGCATCTT 
TCGGAATCCG TGCCGCCGGG ATCCGATCTC GCCGATCTTT TGAGGAAAAA TCCGAACGAC 
TACGCCATGT CGCTCGGTCA CGTCCTTGAT CTGACGCCGC GCGCGATTGG TCTGTTCCGC 
CTGCCGATGG GACTGTTCGC GGGGTCGTTC TTCGTGGGCA GCATCGCGAA CTTCTGGTTG 
CGTTGGAAGC GCAAAGCCAA CGCCGCGAAC TGGGCGCTCG CATTGATGAT GTTCCCGGTT 
CTCTACTGCG TTCACGTGGG GATGGTGGAC TTCGCACCGA TTCTCTCTTC GAAGACGCTC 
GCCGTAGCCA TCGACAAGCA ATGGCAATCA GGCGATGTCA TCGTAGTAAA CGGGCCCTAT 
GAAGAAGCCT CGACCTTGAA TTTCTATACT GGGAAACTAA TCCATATCAT TAACAATCGG 
GAACACGGAA ACGTCTATAA TGGCGCGCTG TACCCTGACG CTCCGCCCAT CTTTGAAGAT 
GATGCCTCGT TTCAGAAGTT GTGGAATGGA CCTCAGCGCA TCTTCGTGTG GACGCAAGAG 
GAAAAGGCTC TGTCCGTGCA ACGTCTCGGC AATAGTTACG AGATCGCGCG GAGCGGCGGT 
AAGCTCATCC TCAGCAATCG TCCGAACTGA

Protein sequence

MISSTTPAQP VVVGRSQSSK AKLHIVIISL FWLVIYIPGL FTPALLDDAD SIHAEAAREM 
ITRHDWTTLY IDGLRYLEKA PLMYWGMASS FKMFGVTEWT ARLPLTLGVL ATLLATYAIG 
KRNLGERAGF WAAIILGTGV GTYIFTRILI PDLLVGLFLT IGFDFFLRGI DQEKPSIASA 
AGLAAAAALN ILTKGFIGVI FPIGIIVVYL FLTHNLKHLL KMRWLLMIGV LLVIAAPWHI 
LASLANPPQG QARGFFWWYF INEHILRYLG KRVPKDYDTV PLAIFWSLMV LWLLPWCAFA 
LQAIARVPRK LRELDRRGRA LVLFTIWMVL ILFFFSFSTR QEYYTIPALP ALALITADWL 
VAEDESPEKS SLRKWGMIGS GFLLFLGIAF AGTASYILHL SESVPPGSDL ADLLRKNPND 
YAMSLGHVLD LTPRAIGLFR LPMGLFAGSF FVGSIANFWL RWKRKANAAN WALALMMFPV 
LYCVHVGMVD FAPILSSKTL AVAIDKQWQS GDVIVVNGPY EEASTLNFYT GKLIHIINNR 
EHGNVYNGAL YPDAPPIFED DASFQKLWNG PQRIFVWTQE EKALSVQRLG NSYEIARSGG 
KLILSNRPN