Gene Haur_4242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4242
Symbol
ID	5736096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5410258
End bp	5411388
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	53%
IMG OID	641281397
Product	carbamoyl-phosphate synthase, small subunit
Protein accession	YP_001547002
Protein GI	159900755
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACGCG CATTACTGGC ATTGGAAGAT GGACGCACCT TTTGGGGGCG GGCTGTCGGT 
GCACGCGGCG AACGTGCAGG TGAAGTTGTA TTCAATACCA GCATGACTGG CTACGCTGAA 
ATTTTGACCG ATCCTTCATA TCGCGGTCAG TTAGTAACCT TAACCGCCTC GCATATTGGC 
AATTATGGCA TTGACGAGGT TGATCTTGAG GCAGCCATGC CTTGGGCCGA AGCCTTGATC 
GTGCGTTCAT TTACCGAGCG GCCATCCAAT TGGCGTTCGC GCGAATCTCT CAGCGAGCTA 
TTAGCACGGC GCGGTGTTAT GGCGGTGGCT GATTTAGATA CCCGAGCCTT GACTCGCCAT 
ATTCGGGCAG CCGGCGCAAT GCGGGCGGTG CTCTCAACCG AAGATCTTGA TCCGGCTAGT 
TTGGTCGCCA AAGCTCAAGC CATCCCGGTG ATGGAAGGCC GCGATTTGGC TAGCGACGTG 
GGAACCCAAA GCATTTATGA GTGGAATGAA GGCACACCTG CCGATTTCAC TACCTTACAA 
CTAGCGATTC CTGAACAATT GCACAACCGC CATGTCGTAG TTTACGATTT TGGGGTCAAA 
CGCAACACCC TGCGGCGCTT GGTCGATCTT GGTTGTAAGG TCACAGTTGT GCCCAATCGC 
ACTTCAGCCG AAGCGACCCT AGCCTTAAAA CCTGATGGTA TTTTGATTTC AAATGGCCCA 
GGCGACCCTG CCACCTTGGA GTATGCGGTC GAAACGATTC GCCAGTTGAT CGGCAATGTG 
CCAGTGTTTG GCATCTGCCT TGGGCATCAA TTGATTGGCC AAGCCTTGGG TGGTACAACC 
TTCAAATTGC CTTTTGGTCA TCATGCTGGC AATCACCCAG TGTGCGATAC CAGCACTGGC 
AAAGTCCGAA TCACTGCTCA AAATCATGGC TTTGCCCTCG ATCCAGCCAG CTTGCCCAGC 
GATGTGCAGG TGACCGAAGT TAGTGGTAAC GACCAAACCT GTGAAGGCTT GCAACACAAG 
AGCTTGCCTG TTTTCAGCGT GCAATATCAC CCTGAGGCTG GGCCTGGCCC TCACGATGGA 
GATGAACACT TCCGGCGTTT TATCAGCCTC GTTGATCAAC AACGTAGCTA A

Protein sequence

MTRALLALED GRTFWGRAVG ARGERAGEVV FNTSMTGYAE ILTDPSYRGQ LVTLTASHIG 
NYGIDEVDLE AAMPWAEALI VRSFTERPSN WRSRESLSEL LARRGVMAVA DLDTRALTRH 
IRAAGAMRAV LSTEDLDPAS LVAKAQAIPV MEGRDLASDV GTQSIYEWNE GTPADFTTLQ 
LAIPEQLHNR HVVVYDFGVK RNTLRRLVDL GCKVTVVPNR TSAEATLALK PDGILISNGP 
GDPATLEYAV ETIRQLIGNV PVFGICLGHQ LIGQALGGTT FKLPFGHHAG NHPVCDTSTG 
KVRITAQNHG FALDPASLPS DVQVTEVSGN DQTCEGLQHK SLPVFSVQYH PEAGPGPHDG 
DEHFRRFISL VDQQRS