Gene Acid345_1703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1703
Symbol
ID	4070486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2067503
End bp	2068549
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	637983711
Product	galactose-1-phosphate uridylyltransferase
Protein accession	YP_590778
Protein GI	94968730
COG category	[C] Energy production and conversion
COG ID	[COG1085] Galactose-1-phosphate uridylyltransferase
TIGRFAM ID	[TIGR00209] galactose-1-phosphate uridylyltransferase, family 1

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.330674
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGACG CGACGAAGTC CACGCCGCAT CGGCGTTTCA ATCCGCTCAC TGGCGAATGG 
ATCCTCGTCT CTCCGCACCG GACCCAACGT CCCTGGCAAG GTCAGGTTGA GAAAGCCCCG 
CGTCCCGCCG CTCTCGAGTA CGACCCCGAG TGCTACCTCT GTCCCGGCAA TGCTCGCGCC 
GGAGGACACC GCAATCCGCC GTACATATCT ACGTTCGTTT TTGAGAATGA CTACGCCGCT 
CTCAAGCCCG ATATCGTTGA GTTCGAGCGG AACGAATCGG GCTTGCTCAT CGCACAAAGT 
GAACGCGGTA TCTGCCGCGT CCTTTGTTTC TCACCGCGAC ACGACCTGAC TCTATCGCGT 
ATGGATCCGC CTGCGATCCG AACTGTCGTC GATCTCTGGT CGCAGCAGTA TGTCGAACTC 
GGCGGCAAAT CCTGGATCAA CTACGTGCAG ATCTTCGAGA ACCGCGGCGA GATGATGGGT 
GCCAGCAATC CGCATCCCCA CGGACAGATC TGGGCCAACT CGAGCGTTCC GAACGAACCC 
GGCAAGGAAC AGCTCTCTCA GCAGAAGTAT CGCGATTCGC GCGGCTCATG CTTGCTCTGT 
GATTGCGTTA AGTTGGAAAC CAAGGCCGCC GAGCGCGTCG TGTGCGAAAA TGGCGGTTTT 
GTCGCGCTCG TGCCTTTCTG GGCGGTGTGG CCGTTCGAAG TGTTGCTCGT TTCCAAGCGC 
CATGCGCGGG ATCTCACCGT TCTGAGCGAC TCCGAGCGAG ACGCGCTTGC CGACATCCTC 
AAGCGTCTGA CCACGCGCTA CGACAATCTC TTCGAGATCT CATTTCCGTA TTCAATGGGC 
TTTCACCAAG CGCCAACCGA CGCTCAGTCC CACGACGAAT GGCACCTGCA TGCGCACTTC 
TATCCGCCGC TGCTACGCTC GGCAAGTGTC CGGAAATTTA TGGTGGGATA CGAAATGCTG 
GGCACGCCCC AGCGCGACAT CACCGCGGAA AGCGCCGCGA AACGTCTGCG CGAACTGAGT 
GAAGTTCATT ATCTCGATCG CGAATAA

Protein sequence

MSDATKSTPH RRFNPLTGEW ILVSPHRTQR PWQGQVEKAP RPAALEYDPE CYLCPGNARA 
GGHRNPPYIS TFVFENDYAA LKPDIVEFER NESGLLIAQS ERGICRVLCF SPRHDLTLSR 
MDPPAIRTVV DLWSQQYVEL GGKSWINYVQ IFENRGEMMG ASNPHPHGQI WANSSVPNEP 
GKEQLSQQKY RDSRGSCLLC DCVKLETKAA ERVVCENGGF VALVPFWAVW PFEVLLVSKR 
HARDLTVLSD SERDALADIL KRLTTRYDNL FEISFPYSMG FHQAPTDAQS HDEWHLHAHF 
YPPLLRSASV RKFMVGYEML GTPQRDITAE SAAKRLRELS EVHYLDRE