Gene Sare_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1130
Symbol
ID	5703761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1280273
End bp	1281370
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	70%
IMG OID	641270645
Product	branched-chain amino acid aminotransferase
Protein accession	YP_001536029
Protein GI	159036776
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01123] branched-chain amino acid aminotransferase, group II

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.4266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000123663
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCGGTG GTGACAAGCT CGACTTCGAG ATCCGTCCGA ATCCCGCGCC GGTATCCGCC 
ACGGACCGGG CCGCGCTGCT GGCCGACCCG GGCTTCGGGC GGGTCTTCAC CGACCACATG 
GTCACCATCC GCTATGCCGC CGGCAAGGGC TGGTACGACG CGCGGGTCGA GGCGCGGGCG 
CCGATCCCGA TGGACCCGGC CGCCGCGGTC CTGCACTACG CCCAGGAGAT CTTCGAGGGC 
ATGAAGGCGT ACCGGACCGT CAGTGGTGGC GTGACCATGT TCCGGCCGTA CGCCAACGCG 
GCCCGGTTCG CCGCGTCCGC CCGGCGGATG GCAATGCCCA CGCTGCCCGA GTCGGTGTTC 
GTCGATTCCC TGCGCCGGCT GATCGAGGTC GACCGGGAGT GGATTCCCGA GGGTGAGGAC 
GGCAGCCTCT ACCTGCGGCC GTTCATGTTC GCCAGCGAGG TCTTCCTGGG TGTGCGGCCC 
GCCAACGAAT ACCTGTACGC GGTGATCGCC TCCCCGGTCG GCGCGTACTT CTCCGGTGGG 
GTGAAGCCGG TCACCGTCTG GGCCTCGCCG GACTACACCC GGGCCGCGCC CGGTGGCACC 
GGCGCCGCCA AGTGCGGCGG CAACTACGCC AGTTCGTTGG TCGCCCACGC GGAGGCCCTT 
GAGCACGGCT GCGACCAGGT CGTCTTCCTG GACGCGGTGG AGCGCCGCTT CGTCGACGAA 
CTGGGTGGCA TGAACCTGTT CTTCGTCTAC GACGACGGTA CTCTGGTCAC CCCGCCGCTG 
ACCGGCACCA TCCTGCCCGG CATCACCCGG GAGTCGGTGC TCGCGCTCGC CGCCGAGGCC 
GGCCACCAGG TGGCGGAGCA GCCGATCGCC TTCACCGACT GGCAGGCCGA CGCGGCGAGC 
GGCCGCCTGC GTGAGGTCTT CGCCTGCGGA ACGGCCGCGG TGATCACGCC GGTCGGCGCG 
GTCCGTTCCC CCGACGGCGA GTTCCGCATC GGCGGCGGTG AGCCTGGCCG GGTCACCATG 
GCGTTGCGTC AGCAGCTCGT CGACATCCAA CGTGGCAAGG CCGCAGATCC ATACAACTGG 
GCCCACCACG TGCTCTGA

Protein sequence

MSGGDKLDFE IRPNPAPVSA TDRAALLADP GFGRVFTDHM VTIRYAAGKG WYDARVEARA 
PIPMDPAAAV LHYAQEIFEG MKAYRTVSGG VTMFRPYANA ARFAASARRM AMPTLPESVF 
VDSLRRLIEV DREWIPEGED GSLYLRPFMF ASEVFLGVRP ANEYLYAVIA SPVGAYFSGG 
VKPVTVWASP DYTRAAPGGT GAAKCGGNYA SSLVAHAEAL EHGCDQVVFL DAVERRFVDE 
LGGMNLFFVY DDGTLVTPPL TGTILPGITR ESVLALAAEA GHQVAEQPIA FTDWQADAAS 
GRLREVFACG TAAVITPVGA VRSPDGEFRI GGGEPGRVTM ALRQQLVDIQ RGKAADPYNW 
AHHVL