Gene Haur_1241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1241
Symbol
ID	5733149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1446021
End bp	1447421
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	54%
IMG OID	641278381
Product	pyridoxal-dependent decarboxylase
Protein accession	YP_001544017
Protein GI	159897770
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0076] Glutamate decarboxylase and related PLP-dependent proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCCAG TTTTAGCCCA CGATGCCGCT CAAATCGACC ACATTTTAGC GCAGACCCTT 
GCCACAGCCA AACAATTTCT CCACGATTTG CCACAGCGTC CGGTTGGAGT TGCGCCGCAA 
AGCCACCAAC CAAGCCAATT ACCAAGCGCT GGATTAGGAG CCGAACAAAC GCTTGAGCAT 
TTTTTGGCCC GCTACAGCGA TACATTAACT GGTAGCACTG GTCCGCGCTA TTGGGGCTTC 
GTCACTGGCG GCGCAACTCC GGCAGCACTG GCAGGCGATT GGCTGGTCAG CACCTTCGAT 
CAGAATCCAA GTGGCACAAC CGAAACCGCC GCGATTCGGG TTGAAAACGA AGCCATCAGC 
ATGTTGCGCG AACTCTTTGG CTTGCCCACA AGCTTTAGCG GCGCATTCGT TTCTGGGGCA 
ACGATGGCCA ATTTTGTCGG CTTGGCGATT GGGCGGCAAT GGGCGGCTCA ACAACTCAAC 
CATGATGTTG CCCGCATGGG TTTATATGGG CTTGCGCCAA TTCCAGTTTT GAGCGGAGCA 
CCGCACTCAA GCATTTACAA GGCCATGTCA ATGTTGGGCA TGGGTCGTCA ACAGCTGCAA 
ACAATCGCCT TACAGCCCGA ACGCGAGGCG GTTGACATCG CAGCATTACG TCAAGCACTT 
CAAGCCTTGT CAGCGAACCA ACCTGCGATC GTTGTTGCCA ATGCAGGCAC GGTCAATAGT 
GTCGATTTTG ACGATCTTAT GGCAATTGCC GCGCTCAAGC AGGAATTCAA TTTCTGGTTG 
CATGTTGATG CGGCTTTTGG TGGTTTTGCC GCCTGTTCGC CGCGCTTTGC TCATTTAGTG 
CATGGGCTTG AACAAGCCGA TTCGCTGACG ATTGATGCCC ACAAATGGCT CAATGTGCCG 
TATGATTCAG CTATGCAATT CACCCGCCAT AGTGCCTTGC AAGTTGAGGT GTTTCATAAT 
AGCGCGGCCT ACCTCAGCCC AATTGGCGAG AATCCAGGCT TTTTTCATCG CACGCCCGAA 
AATTCACGCC GTTGGCGAGC ACTGCCAGCA TGGTTCACGC TTATGGCCTA TGGCTCGGCT 
GGCTATCAAG AAATGGTTGA GCGCGATTGC GATTTAGCCC AACTGCTGGC TAGCCATATC 
AGCGATTCAC CGTTGTTTCG CTTGGTCGCG CCTGTGCGCA TGAACGTCGT TTGTTTCACT 
TTGGCGGGCA ATCCTGATAG CACTACAATT CAGGCTTATC TTGATGCAGT ACGGGCTAGC 
GGAGCAGTTT TTATGACCGC GACTGTCTAT GCTGGACAAC CAGCGATTCG CGCGGCCTTC 
TCAAATTGGC GCACCACCAC CGCCGATGTT GGGCTGGCTT GGCAGGCAAT GGAGCGAGTC 
GCCATAGAAC ATAGAGCATA G

Protein sequence

MHPVLAHDAA QIDHILAQTL ATAKQFLHDL PQRPVGVAPQ SHQPSQLPSA GLGAEQTLEH 
FLARYSDTLT GSTGPRYWGF VTGGATPAAL AGDWLVSTFD QNPSGTTETA AIRVENEAIS 
MLRELFGLPT SFSGAFVSGA TMANFVGLAI GRQWAAQQLN HDVARMGLYG LAPIPVLSGA 
PHSSIYKAMS MLGMGRQQLQ TIALQPEREA VDIAALRQAL QALSANQPAI VVANAGTVNS 
VDFDDLMAIA ALKQEFNFWL HVDAAFGGFA ACSPRFAHLV HGLEQADSLT IDAHKWLNVP 
YDSAMQFTRH SALQVEVFHN SAAYLSPIGE NPGFFHRTPE NSRRWRALPA WFTLMAYGSA 
GYQEMVERDC DLAQLLASHI SDSPLFRLVA PVRMNVVCFT LAGNPDSTTI QAYLDAVRAS 
GAVFMTATVY AGQPAIRAAF SNWRTTTADV GLAWQAMERV AIEHRA