Gene Hhal_1973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1973
Symbol
ID	4710452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2174385
End bp	2175674
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	67%
IMG OID	639856446
Product	aminotransferase, class I and II
Protein accession	YP_001003539
Protein GI	121998752
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.238227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACTT CAAGAGAGGG TGCGAGCCGG CCGCTCCGCC CGGGGCGGCC GACGCGCGAT 
CGCAGTGCAG AGCAACGCGG AGAGCTTGCC GTGGCCTATC CCGACGATAT CGATCCCGAC 
GACGAGCGCG AGCCGGTGTG GAGCCCCTCG ATCCGGGCCC TGCCCATTCC CGGCATCCGC 
AAGATGGTGA ACATGGCGGC CGAGATGGAC GACGTCATCC ATCTGTCCAT TGGCCAGCCG 
GACTTCCCCA TGCCGGAGCA CGTTGTCGAG GCCCACATCC AGGCCCTGCG CGACGGCAAG 
ACCGGCTACA CCATGGATGC CGGCCTGCCG CAGATGCTCG AGGCGGTGGC GGAGTACTAC 
AGCCACCGCT ACGACCGCCC GCTGGAGCCG GAGAACGTGC TCATCACCAC CGGCGCCACC 
GAGGCGATGT ATCTGGCCAT CGCGGCCACC GCGGCGCCTG GGCGGCAGTT CCTGATCCCG 
GATCCGACCT TCCCGCTCTA CGCCCCGCTG ATCCGCATGA ACGGCGCCGA GGTCAAGCCG 
ATCCCCACCC GCGCAGAGCA CGGTCACCAG ATCGATCCCC AGGAGGTGAT CGACAACATC 
GGCATGCGCA CCTTCGGGAT CATCCTCAAC TCGCCGAGCA ACCCCACCGG TACGGTCTAC 
CCCCGGGAGA CCATCGAGGC CATCGTCCAG GAGGCCGCCT ACCGTGGGGT CTACGTCTTC 
AGCGACGAGG TCTACGACCA CCTGCTGCTC GACGAGATGG AGTATCCGAG TGTGCTGCGC 
TGCACCTCGG ACCTGGACCA CGTCATGGCG GTCTCCAGCC TGTCGAAGAC CTTCAGTATG 
GCCGGTCTGC GCATCGGCTG GTTGATCTCC AGCCAGGGGG CGATCAAGAA GCTCCAGCGC 
TTCCATATCT TCACCACCAC GGTCGCCAAC ACGCCGGCGC AGTGGGCCGG GGTGGCCGCC 
CTCAAGGGGG GGATGGCGTG CGTCGACGAG ATGCTCGAGG CCTACCGTCA GCGGCGTGAC 
CGCATCGTTG AGCTCGTTAG CAAGACCCCG CACCTGACCA GCTACCGGCC GCAGGGGGCG 
TTCTACATCT TCCCGTCGCT GCCGCCGAAC ACCGACGCCA CCAACCTGGC CACGCGCATG 
CTCAAGGAGA CCGGCGTGTG TGTCGTCCCG GGCGACGCCT TCGGCGACAG CTGCCCGAAC 
TCGTTGCGCA TCAGCTACGC GGCCTCGATG GACGACATCG AGCGGGCCTT CGAGCGCATC 
ATCCCGTGGA TGGAGAAGCA GGGCTTCTAG

Protein sequence

MTTSREGASR PLRPGRPTRD RSAEQRGELA VAYPDDIDPD DEREPVWSPS IRALPIPGIR 
KMVNMAAEMD DVIHLSIGQP DFPMPEHVVE AHIQALRDGK TGYTMDAGLP QMLEAVAEYY 
SHRYDRPLEP ENVLITTGAT EAMYLAIAAT AAPGRQFLIP DPTFPLYAPL IRMNGAEVKP 
IPTRAEHGHQ IDPQEVIDNI GMRTFGIILN SPSNPTGTVY PRETIEAIVQ EAAYRGVYVF 
SDEVYDHLLL DEMEYPSVLR CTSDLDHVMA VSSLSKTFSM AGLRIGWLIS SQGAIKKLQR 
FHIFTTTVAN TPAQWAGVAA LKGGMACVDE MLEAYRQRRD RIVELVSKTP HLTSYRPQGA 
FYIFPSLPPN TDATNLATRM LKETGVCVVP GDAFGDSCPN SLRISYAASM DDIERAFERI 
IPWMEKQGF