Gene Haur_4138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4138
Symbol
ID	5735999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5285338
End bp	5286702
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	54%
IMG OID	641281292
Product	argininosuccinate lyase
Protein accession	YP_001546898
Protein GI	159900651
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGGGTG GACGATTTAG TGGCTCGTTG GCTGAGCATA TGCGCTTATT CAACGATTCG 
TTTCCAATCG ATCGGCGCTT ATGGGCCGAG GATATTCGCG GCTCAATTGC TTGGGCCAAT 
GGCTTAGAAC GCGCTGGCAT TTTGCAAGCC GCCGAATGCC AAGAACTGAT CGCAGGCTTG 
CGCCAAGTCT ATCAAGAGTT TGAAGAAGGC CTGTTTTTGC CATTAACCAG CGACGAAGAT 
ATTCACACGG CGGTCGAACG CCGCTTGGGT GATTTTATCG GAGCCTTGGC GGGCAAATTG 
CATACTGGCC GCTCCCGCAA CGATCAAGTG GCGACCGATA CCCGTTTGTG GACATTGGGC 
GCACTCAAAT TGGCCGATGA TCTTATTCGT GATGTGCAAG CGGCCTTGCT GGAACAAGCC 
AAAGCGGTTG GCGAAGCAAT GTTACCTGGC TATACCCACC TGCAACGGGC GCAGCCAGTC 
TTGTTATCGC ACGCACTTTT AGCCCATTTT TGGCGTTTAG ATCGCGATCG CCAACGCTTG 
CACGATGCAA CCAAGCGCGT CAGCGTACTG CCGTTAGGCT CAGGCGCACT GGCTGGTACA 
GCCTTCGCGG TTGATCGGGC GGCACTGGCA GCCGAATTAG GCTTTACCAG CATCAGCCAA 
AATAGCCTCG ATGCTACCAG TGATCGCGAT TATATTGTCG AAATTTTGGC GGCAATCGCG 
CTGTTGGGTG TCCACATTAG CCAGCTCGCC GAGGATTGGA TCATCTGGAG CAGCTCGGAA 
TGGGGTTTTG TCGCGCTAGA CGATGCCTAT TCAACTGGCT CAAGTTTAAT GCCGCAGAAG 
AAAAACCCTG ATTCGTTGGA GTTGGCTCGT GGCAAATCTG GCCGTTTGAT CGGCAATTTA 
ATTACCGTTT TGACCTTGCT CAAAGGCCTG CCATCGGCCT ACGACAAAGA TTTACAAGAA 
GATAAAGCGC CCTTATTCGA TGCGATCGAT ACATTAAGCC TGACGTTACC AGTGGTTGCA 
GGTGCAATTC GTACCGCTCG TTTCAACACC GAACGCATGG AATCGGCGCT TGATGATGCA 
ATGCTGGCAA CCGATGTAGC CGATGAATTG GTACGCCGGG GAGTGCCATT CCGCGAGGCG 
CATCATATTG CTGGGCGTTT GGTGCGCGAA GCCGAACAAC GTGGGGTTGG CATGCGCCAA 
TTGCCTGCCG AAAGCTTCGT AGCCGCCCAC CCAAGCCTGA CCGATGTTGC TGGTTTATTC 
GATTTTGCTC GTTCCGTCGC CATGCGCGAC GTACCTGGTG GAACAGCGCC CAACGCCGTG 
CGCGACCAAC TGATTGCTGC TCAACACGTT TTAGCAGAAG GTTGA

Protein sequence

MWGGRFSGSL AEHMRLFNDS FPIDRRLWAE DIRGSIAWAN GLERAGILQA AECQELIAGL 
RQVYQEFEEG LFLPLTSDED IHTAVERRLG DFIGALAGKL HTGRSRNDQV ATDTRLWTLG 
ALKLADDLIR DVQAALLEQA KAVGEAMLPG YTHLQRAQPV LLSHALLAHF WRLDRDRQRL 
HDATKRVSVL PLGSGALAGT AFAVDRAALA AELGFTSISQ NSLDATSDRD YIVEILAAIA 
LLGVHISQLA EDWIIWSSSE WGFVALDDAY STGSSLMPQK KNPDSLELAR GKSGRLIGNL 
ITVLTLLKGL PSAYDKDLQE DKAPLFDAID TLSLTLPVVA GAIRTARFNT ERMESALDDA 
MLATDVADEL VRRGVPFREA HHIAGRLVRE AEQRGVGMRQ LPAESFVAAH PSLTDVAGLF 
DFARSVAMRD VPGGTAPNAV RDQLIAAQHV LAEG