Gene Acid345_2278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2278
Symbol
ID	4073272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2701981
End bp	2703048
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	58%
IMG OID	637984294
Product	hypothetical protein
Protein accession	YP_591353
Protein GI	94969305
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCGTC GTCTCTTGTT TTTTCTGGCG CTAGTCTCTG TCTCTACCCT GCTCGCGCAA 
TCCAAGCCAG CCACCCAGGA AGGCGACTTC GTCCTTCACG ACTTCACCTT CCGCTCCGGC 
GAAAAGCTTC CCGAAGTTCG CATGCACTAC ACCACGCTTG GCAAGCCAGC GAAAGATGCG 
AGCGGCCGCG TGACCAACGC CGTGCTCATC TTGCACGGGA CTGGCGGCTC CGGCGCACAA 
TTTCTGCGTG CGCAATTTGC AGACGTCCTC TACGGGCCCG GGAGGTTGCT CGATGCCACC 
AAGTACTTCA TCGTCCTACC CGACAACATC GGCCACGGCA AATCCAGCAA GCCCAGCGAT 
GGTCTCCACG CTCGGTTTCC GCAATACGAC TACGACGATA TGGTGCTGGC GCAGCACGAA 
CTGCTGGAAA AGGGCCTCGG TGTGAATCAC CTTCGCTTGA TCCTTGGCAC CTCGATGGGC 
TGCATGCACT CGTGGGTCTG GGGAGAGACG TATCCCGATT TCATGGACGC GATGATGCCG 
CTCGCGTGCC TGCCGGTGCC GATCGCGGGA CGCAATCGAA TCTGGCGAAA GATGATCATC 
GATGGCATCA AGAACGATCC GGAGTGGAAG AACGGCGACT ACACCACGCA GCCACACGCG 
GGTATCGAGA TTGGCACCGA CTTCCTCATC ATCGCCGGCA GCGCGCCGAT ACCGATGCAG 
AAAGGTGAAC CAACCCGCGA TGCCGCCGAC AAATATCTTG ACGACACGTT CAAGCGGCAA 
TCCGCCGGAC TTGATGCCAA TGACCTGCTC TATGCTGTCA GCGCTTCGCG CAATTACGAT 
CCGTCGGCCA AACTCGATGC CATCAAAGTC CCCGTGATGT TTGTAAATTC CGCCGACGAC 
TTCATCAATC CGCCGGAACT CGGCATTGCC GAGCAGGAGA TCAAGAAAGT GAAGCGCGGC 
AAGTTCGTTC TCATTCCCGC CTCCGACCAA ACGCACGGAC ACGGCACACA TACGTGGGCT 
GTCATCTGGC AGAAATATTT GAAGGACTTG CTGGAAGAAT CGAAGTAG

Protein sequence

MLRRLLFFLA LVSVSTLLAQ SKPATQEGDF VLHDFTFRSG EKLPEVRMHY TTLGKPAKDA 
SGRVTNAVLI LHGTGGSGAQ FLRAQFADVL YGPGRLLDAT KYFIVLPDNI GHGKSSKPSD 
GLHARFPQYD YDDMVLAQHE LLEKGLGVNH LRLILGTSMG CMHSWVWGET YPDFMDAMMP 
LACLPVPIAG RNRIWRKMII DGIKNDPEWK NGDYTTQPHA GIEIGTDFLI IAGSAPIPMQ 
KGEPTRDAAD KYLDDTFKRQ SAGLDANDLL YAVSASRNYD PSAKLDAIKV PVMFVNSADD 
FINPPELGIA EQEIKKVKRG KFVLIPASDQ THGHGTHTWA VIWQKYLKDL LEESK