Gene Acid345_0568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0568
Symbol
ID	4073057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	694732
End bp	695931
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	637982573
Product	L-aspartate aminotransferase
Protein accession	YP_589647
Protein GI	94967599
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0641673
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCTG CAACATCGCA ACTGACGCTC AGCCCCGCCG CGCGGATGAA CCGCATTGAA 
ATTTCGGCAA CCCTCGCGGT TGTGAACGAA GCCGAGAAAC TGCGCTCTGC CGGGGTGGAT 
CTGGTGGACT TTGGCGCGGG CGAGCCGCAC TTCGGAACGC CGCAGCACAT CCGGGAAGCG 
GCGATTGCGG CGATCCATAA CAACTTCTCG AAATACACGG CAGTGGCGGG CACGGCGGAA 
CTGCGCGATG CGATTGCGAA GCGGCACGCC ACAGACTTCG CCACCGACTA CAAGCGCGAG 
GAAGTGATCG CTTCCGTGGG CGGCAAGCAT GCGCTGTTCA ACGCGATCCA GGTGCTGGTG 
GACCACGGCG ATGAAGTCAT CATCCCGGTG CCGTACTGGG TGTCGTTCAA AGACATGGTG 
CAGTACTCGG GCGGCAAGCC GGTGTTTGTA GAAGCGGATG AGAGCCAGAA CTTCCGGCTG 
ACGGCGGCGA TGGTCGAGAA GGCCGTGACG CCGAAGACGA AGCTGATCAT TTTAAATTCG 
CCGTCGAACC CGTCGGGCGC AGTGATGGCG CCGGAGGACA TGAAGTCGAT AGCGCGCTTT 
GCCTATGAAC GCGGGATTTG GGTCATCTCC GATGAGTGCT ATGTGTATCT GAACTACACC 
GGCGAAGAGT TTTCGCTGGG CAGCCTGACC GAAGTGAAGG AGCGGCTGCT GGTGGTGGGA 
TCGCTTTCGA AGACCTACGC CATGACCGGA TGGCGGCTGG GCTACACGCT GGCGCCGGCG 
GCGGTGGTGA GCCAGATGCA GAAGCTGCAA AGCCAATCGA CGTCGAACCC GACCTCAATT 
GTGCAGAAGG CAGCGGTGGC GGCGTTGAAT GGTCCGCAGG AGTGCGTCGC CGAGATGCGC 
GCCGACTACA TTAAGCTGCG CGACGAGATC GTGAGTGGGC TGCGCTCGAT TCCGGGCGTG 
AAGTGCACCA TGCCACAGGG CGCGTTCTAC GCCTATCCGG ACATCAGCTG CGCGTTTGGC 
AAGGCAGGGA TGAACTCGGC GGCCGACGTC GCGAAGAAGC TACTGCACGA GGCACACGTG 
GTCTCGGTCC CGGGCGAGGC GTTCGGCACA ACCAAACACA TCCGGCTGTC GTACGCGGCT 
TCGCATGAGA ATGTGGCGCG CGGTTTGGAG CGGATGCACA AGTTCTTCGC CAGCCTTTAA

Protein sequence

MSSATSQLTL SPAARMNRIE ISATLAVVNE AEKLRSAGVD LVDFGAGEPH FGTPQHIREA 
AIAAIHNNFS KYTAVAGTAE LRDAIAKRHA TDFATDYKRE EVIASVGGKH ALFNAIQVLV 
DHGDEVIIPV PYWVSFKDMV QYSGGKPVFV EADESQNFRL TAAMVEKAVT PKTKLIILNS 
PSNPSGAVMA PEDMKSIARF AYERGIWVIS DECYVYLNYT GEEFSLGSLT EVKERLLVVG 
SLSKTYAMTG WRLGYTLAPA AVVSQMQKLQ SQSTSNPTSI VQKAAVAALN GPQECVAEMR 
ADYIKLRDEI VSGLRSIPGV KCTMPQGAFY AYPDISCAFG KAGMNSAADV AKKLLHEAHV 
VSVPGEAFGT TKHIRLSYAA SHENVARGLE RMHKFFASL