Gene Acid345_4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4034
Symbol
ID	4071173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4769051
End bp	4770241
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	637986064
Product	threonine synthase
Protein accession	YP_593108
Protein GI	94971060
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.338986
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGA TTTCGCATTT TGAGTGCGCA CGGTGCGGGG AGAAACTCGC GCCGGCAACA 
CTGCTAAATG TTTGTCCGAA GTGTGCGGGG CCGCTCTGGG TGCGTTATGA GTTCGGGCGA 
CCCGATCGCG AAGCTGTGAA GCTCGGGCCG GCGACGATGT GGCGCTATTC CTCCGTTCTT 
CCGGACGTTG AGCCGGTCAC GCTCGGCGAA GGTTTTACGC CAATGCTTCC CAGCCGCAAG 
CACGCGAATG TGTTCATAAA AGATGAAGGT TTGAATCCCA CCGGCTCGTT CAAAGCACGC 
GGCCTTGGGA TGGGCGTGAC CATGGCCCGC TTTTACGGCG TGAAGAAGAT TGCGATCCCA 
TCGGCAGGAA ACGCGGCTAG CGCGCTGGCA GCGTATTGCG CGGCGGCGAA GATCGAGGCG 
CACATCTTCA TGCCGAAAGA CGTGCCGATG GCGAACCGCA TTGAGTGCGA GAGCTACGGC 
GCGCACGTTA CCTACGTCGA TGGACTCATC AGCGACTGCG CGAAGATGGT CGCGGAGCGC 
AAGCAGGCGG AGGGATGGTT CGATATCTCG ACGCTGAAAG AACCGTTCCG TGTCGAAGGC 
AAGAAGACTA TGGGGTACGA GGTGGCGGAG CAACTCGGGT GGGAGTTGCC GGACGCGATC 
ATCTATCCGA CGGGCGGTGG CGTGGGTCTG CTTGGGATGT GGAAGGCCTT CGAAGAGATG 
GAGCAGTTGG GGTGGATTGG CAGCAAGCGT CCGAAGATGA TATGTGCGCA GGCCACAGGC 
TGCGCACCGG TAGTGAAGGC GTGGGAAGAG CATCGCGAAA CGATGGAGAT GTGGAAGGAT 
GCGCACACCT CGGCTGCCGG GCTGAGAGTG CCGAAGCCGT ATGCGGATCG CGAGATCTTG 
CACGCGATGA AAGCGAGTGG CGGAACTGCG GTGGCCGTGA CAGACGACGA GATCATGGCG 
GCGTTCTCAT CGTGGGCGCG TGAGGAAGGC GTGTTTGCGG CTCCGGAGGG AGCGGCGGCA 
TTGGCGGCTT ATTGGAAGCT GATCGAGAGC GGATATCTGC GCCCGGAAGA GAAGGTGGTG 
TTGTTCAACA CCGGTAGCGG ATTGAAGTAT ATCGATGTGT TTGAGAAGTA TTTTAGGAAG 
AAGGAGCAGC CGAAATCGAG GGCGCTGGGC GGCATTATTC AGCCTTATTG A

Protein sequence

MAKISHFECA RCGEKLAPAT LLNVCPKCAG PLWVRYEFGR PDREAVKLGP ATMWRYSSVL 
PDVEPVTLGE GFTPMLPSRK HANVFIKDEG LNPTGSFKAR GLGMGVTMAR FYGVKKIAIP 
SAGNAASALA AYCAAAKIEA HIFMPKDVPM ANRIECESYG AHVTYVDGLI SDCAKMVAER 
KQAEGWFDIS TLKEPFRVEG KKTMGYEVAE QLGWELPDAI IYPTGGGVGL LGMWKAFEEM 
EQLGWIGSKR PKMICAQATG CAPVVKAWEE HRETMEMWKD AHTSAAGLRV PKPYADREIL 
HAMKASGGTA VAVTDDEIMA AFSSWAREEG VFAAPEGAAA LAAYWKLIES GYLRPEEKVV 
LFNTGSGLKY IDVFEKYFRK KEQPKSRALG GIIQPY