Gene Haur_4140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4140
Symbol
ID	5736001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5288246
End bp	5289457
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	52%
IMG OID	641281294
Product	argininosuccinate synthase
Protein accession	YP_001546900
Protein GI	159900653
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAATG CGACTGCAAA TAAAGTTGTG CTGGCCTACT CTGGTGGTTT GGATACCAGC 
GTGATCGTGC CGTGGTTGAA GGAACACTAT GGCTGTGAAG TCGTCTGCTA TTGCGCCAAT 
CTTGGCCAAG ATGACGATCT GAGCGGCGTA GAGGCCAAAG CGATTGCTTC GGGCGCAAGT 
GCCTGCTATG TCGAAGATTT GCGCGAAGAA TTTGTGCGCG ATTTCTTGTT CCCGATGTTG 
CAATCAGGTG CAACCTACGA ACGCACCTAC TTGCTCGGCA CAAGCATCGC CCGCCCATTG 
ATCGCTCGTG GTCAGGTGCA AACCGCCTTG AAAGTTGGCG CTGATGCACT TTCTCACGGC 
TGCACGGGCA AAGGCAACGA TCAAGTGCGC TTTGAATTGA CCTACATGGC CTTGGCTCCG 
CATATGAAAA TTATCGCCCC ATGGCGTGAA TGGCATATTC GCTCACGGGA AGATGCATTG 
GATTATGCTG CATTACATAA TGTGCCAGTC ACCAGCACTC GCGCCTCGAT CTACAGTCGC 
GATGGCAATA TTTGGCACTT GAGCCATGAA GGTGGCTCGT TGGAAGATCC ATGGTTAGAA 
CCAGAATTGA CCATGTTCCA ACGCACCGTG ACCCCTGAAG AAGCTCCCGA TTTACCAGAA 
TACTTGGAAA TTGGCTTCGA ACGTGGTATT CCGGTGAGTG TGAATGGCGA GCAACTTGGC 
CCCGTGGCGT TGCTGCAAAC CCTTAACGAC ATTGGCGCTC GTCATGGCGT TGGTCGCGTC 
GATTTGGTCG AAAATCGCTT GGTTGGCATG AAAAGCCATG GCGTATACGA AACACCAGGC 
GGTACATTGC TCTATCGTGC CCACCAAGGC CTCGAAGAAT TGGCGCTTGA TCGCGAAACC 
TTGCACTTCA AAGATACCTT GGCAATCCGC TTCTCAGAGT TGATTTACAA CGGTCAATGG 
TGGTCGCCGT TGCGCTATGC CTTGTCGGCC TTCTTCACTG AAACCCAAAA GAACGTTACA 
GGCGTGACTC GCTTGAAAGT CTTCAAAGGT GGCGTGTATT TGGTTGGGCG CAAGGCTGAA 
CGCAGCTTGT ACGTACCCGA TTTGGCAACC TTCAGCGAAG ATGCCGTTTA TAACCAAGCC 
GATGCTGAAG GCTTTATCAA GCTCTTTGGC TTGCCTCAAA AAGTCGAAGC CTTAACCTCA 
GGAGCCGAAT AA

Protein sequence

MSNATANKVV LAYSGGLDTS VIVPWLKEHY GCEVVCYCAN LGQDDDLSGV EAKAIASGAS 
ACYVEDLREE FVRDFLFPML QSGATYERTY LLGTSIARPL IARGQVQTAL KVGADALSHG 
CTGKGNDQVR FELTYMALAP HMKIIAPWRE WHIRSREDAL DYAALHNVPV TSTRASIYSR 
DGNIWHLSHE GGSLEDPWLE PELTMFQRTV TPEEAPDLPE YLEIGFERGI PVSVNGEQLG 
PVALLQTLND IGARHGVGRV DLVENRLVGM KSHGVYETPG GTLLYRAHQG LEELALDRET 
LHFKDTLAIR FSELIYNGQW WSPLRYALSA FFTETQKNVT GVTRLKVFKG GVYLVGRKAE 
RSLYVPDLAT FSEDAVYNQA DAEGFIKLFG LPQKVEALTS GAE