Gene Acid345_1458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1458
Symbol
ID	4069608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1760589
End bp	1761803
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	59%
IMG OID	637983467
Product	aminotransferase
Protein accession	YP_590534
Protein GI	94968486
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGT TGACCAAAGC CACGCCCATT CAAGCCGCAG ACCGCATGGT GAATGTTCGC 
TATGCGATTC GCGATCTTGC CGTTCTTGCC GACCAGGTTG CCTCGCAGGG AAACAAGATC 
CTCTACTGCA ACATCGGCGA CCCCTGCAAG TACGACTTCC CTGTCCCCGT GCACATCATG 
GAAGCCGCCA TCAAAGCGAT GCGCGACGGC TACAACGGAT ACGGCGAGTC GCTCGGCATC 
AAACCGGCGG TCGAAGCGAT CCGAAATGAA GCTGAACGCG ATGGTTTCAA GAACATCCAA 
GGTGTGTTCG TTGGCCTCGG CAGCGGTGAA GCCATCGACT CCTGCCTGAC GGCGTTGCTC 
AATCCCGGCG AGAATTTTCT CGCGCCCAGC CCCGAATATC CGCTCTACGG CGCCATCACC 
GCCAAGCTTG GTGCTGAACC CAACGCCTAT TTCCTCGATG AATCGAACGA CTGGCAGCCC 
GACGTGGAAG ACCTCGAGCG CCGCATCAAC GCCAAGACGC GCGCACTGCT GATCATTAAT 
CCCAACAACC CGACCGGCGC CGTGTACTCG CGCGAAACGT TGGAGAAAAT TGCCGACGTG 
GCGCGCCGCC ACAATTTGCT TCTGATCTCC GACGAGATCT ATAACAAGCT CGTCTTCGAC 
CCCAGCGCGA AACACATCTC CATCGCTACG CTCGCGCCGG ATGTTCCGTG TATTACCTTC 
AACGGCTTGT CGAAGGCATA TCTCGTGCCC GGATGGCGTA TCGGGTGGGG CGTCGGCACC 
GGACCGGCGG AACTGATCAA GCCCTTCCTC GAGAACATCT ACAAGTTGCT TCGTGCGCGT 
CTCTCCGCGC CGCATCCGTA CCAGTACGCC GTGAAGGCTG CGCTCGAAGG CCCGCAGGAC 
CATCTCAAGT GGGTGAATGA AAAACTCGCA GCGCGCGCCA AGGTCACAAA AGACTGGGCC 
GCCAGCGAAC CGCGCGTCAA CCTGGTCGCG CCGAAGGGCG CGTTCTACGC CTTCCCGTCG 
CTCGACATCC CGGAAGATGA CCTAACCTTT GTCAGCGAAC TCCTGATACA AAAACACGTC 
CTGCTCGTTC ACGGCAGCGG CTTCGGCCAG AAACCCGGCA CACACCACTG CCGTATTGTC 
ACGCTGCCGC AGGAAGCAGT GCTGACCAAC GCCTACGCGA AGGTCAGCGA GTTCTTGAAA 
GAGCGATACC AGTAG

Protein sequence

MSTLTKATPI QAADRMVNVR YAIRDLAVLA DQVASQGNKI LYCNIGDPCK YDFPVPVHIM 
EAAIKAMRDG YNGYGESLGI KPAVEAIRNE AERDGFKNIQ GVFVGLGSGE AIDSCLTALL 
NPGENFLAPS PEYPLYGAIT AKLGAEPNAY FLDESNDWQP DVEDLERRIN AKTRALLIIN 
PNNPTGAVYS RETLEKIADV ARRHNLLLIS DEIYNKLVFD PSAKHISIAT LAPDVPCITF 
NGLSKAYLVP GWRIGWGVGT GPAELIKPFL ENIYKLLRAR LSAPHPYQYA VKAALEGPQD 
HLKWVNEKLA ARAKVTKDWA ASEPRVNLVA PKGAFYAFPS LDIPEDDLTF VSELLIQKHV 
LLVHGSGFGQ KPGTHHCRIV TLPQEAVLTN AYAKVSEFLK ERYQ