Gene Strop_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1106
Symbol
ID	5057553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	1250486
End bp	1252024
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	73%
IMG OID	640473373
Product	histidine ammonia-lyase
Protein accession	YP_001157955
Protein GI	145593658
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.825697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACCG TAGTCATTCA GCCAACCGGG GTCACCCCCG CCGACGTGCT CGCCGTCGCC 
CGCGGCAACG CCAAGGTCGT CCTCGACCCG GCAGCGATCG ACGCGATGAC CGCCAGCCGG 
TCCGTCGTGG ACGGTATCGA GGCCGCCGGC CAGCCGGTGT ATGGCGTGAG CACCGGCTTC 
GGAGCCCTCG CCAACACCTT CGTCGCCCCA CAACGGCGGG CGGAGCTACA GCACGCACTG 
ATCCGTTCGC ACGCCGCCGG GGTGGGAACC GCCATGCCGC GCGAGGTGGT GCGGGCGATG 
ATGCTGCTGC GTGTCCGTTC CCTCGCATTC GGCCGCTCCG GGGTCCGGCC GTTGGTTGCC 
AACGCGCTGG TGGACCTGCT CAACCACGAT GTCACCCCGT GGGTGCCCGA GCACGGGTCG 
CTGGGGGCCT CTGGTGACCT GGCGCCGCTG GCGCACTGCG CGCTGGCGCT ACTCGGCGAG 
GGCTGGGTGC TGGGCGCGGC CGGCGACCGG ATTCCGGCCA GCGAGGCGCT ACGCCGGGCC 
GGTCTCCCGC CGATCGAGCT GGCCGCCAAG GAAGGGCTGG CACTGATCAA CGGCACCGAC 
GGAATGCTCG GCATGCTGCT GATGGCAAGC GACGACGCCG CACACCTGTT TACTCTGGCC 
GATGTGACGG CCGCCCTGGC CGTCGAGGCG ATGCTCGGCT CGGACCGGCC GTTCCGGCCC 
GAGTTGCACA CGATCCGGCC GCACCCCGGT CAGGCCGCCT CGGCGGCCAA CATCCACCGT 
CTGCTCCAGG ACTCGGCGGT GATGGAGTCG CACCGCGACG ACGTGGTGCA CGCGGTGCAG 
GACGCGTACT CGATGCGGTG CGCGCCGCAG GTCGCCGGCG CGGCCCGGGA CACCCTGGAC 
TTCGCCCGAC AGGTGGCAGG CCGGGAACTG ATCTCGGTGG TGGACAATCC GGTGGTCCTG 
CTGGACGGCC GGGTCGAGTC GACCGGGAAC TTCCACGGCG CCCCGCTCGG CTTCGCCGCG 
GACTTCCTCG CCGTCGCCGC CGCCGAGGTC GGCGCGATCG CCGAGCGGCG GGTGGACCGC 
CTGCTCGACG TGACCCGCTC CCGGGACCTA CCGGCCTTCC TCTCCCCCGA CGCCGGGGTC 
AACTCCGGAC TGATGATCGC CCAGTACACG GCGGCCGGCA TCGTCGCGGA GAACCGCCGG 
CTCGCCGCCC CCGCCTCGGT GGACTCCCTG CCCACCAGCG GCATGCAGGA AGACCACGTG 
TCGATGGGCT GGGCGGCGAC CAAGAAGCTA CGGACCGTCC TGGACAACCT AACCAGTCTG 
CTCGCGGTCG AGCTGCTCGC CGCGGTCCGC GGGCTCCAGC TGCGGGCGCC GCTACAACCG 
TCGCCGGCCG GACGCGCCGC CATCGCCGCG TTGACCGGGG CCGCCGGGGA GCCCGGCCCG 
GACATCTTCC TTGCTCCGGT GCTGGAGGCC GCCCGTGAGG TGGTTGCCGG CCCGGAGCTT 
CGGGCCGCGA TCGAACGCGA GGTCGGAACG CTGGCCTGA

Protein sequence

MSTVVIQPTG VTPADVLAVA RGNAKVVLDP AAIDAMTASR SVVDGIEAAG QPVYGVSTGF 
GALANTFVAP QRRAELQHAL IRSHAAGVGT AMPREVVRAM MLLRVRSLAF GRSGVRPLVA 
NALVDLLNHD VTPWVPEHGS LGASGDLAPL AHCALALLGE GWVLGAAGDR IPASEALRRA 
GLPPIELAAK EGLALINGTD GMLGMLLMAS DDAAHLFTLA DVTAALAVEA MLGSDRPFRP 
ELHTIRPHPG QAASAANIHR LLQDSAVMES HRDDVVHAVQ DAYSMRCAPQ VAGAARDTLD 
FARQVAGREL ISVVDNPVVL LDGRVESTGN FHGAPLGFAA DFLAVAAAEV GAIAERRVDR 
LLDVTRSRDL PAFLSPDAGV NSGLMIAQYT AAGIVAENRR LAAPASVDSL PTSGMQEDHV 
SMGWAATKKL RTVLDNLTSL LAVELLAAVR GLQLRAPLQP SPAGRAAIAA LTGAAGEPGP 
DIFLAPVLEA AREVVAGPEL RAAIEREVGT LA