Gene HY04AAS1_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HY04AAS1_1120
Symbol
ID	6743936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Hydrogenobaculum sp. Y04AAS1
Kingdom	Bacteria
Replicon accession	NC_011126
Strand	+
Start bp	1035653
End bp	1037317
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	38%
IMG OID	642750929
Product	Carbamoyl-phosphate synthase L chain ATP-binding
Protein accession	YP_002121784
Protein GI	195953494
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0458] Carbamoylphosphate synthase large subunit (split gene in MJ)
TIGRFAM ID	[TIGR01369] carbamoyl-phosphate synthase, large subunit

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAAAAA ATACCAATAT AAAGAAAATA CTCATCGTAG GAGCAGGTCC TATTATCATA 
GGCCAAGCGG CAGAATTTGA TTATTCTGGT ACTCAGGCTT GCAAAGCCCT TATGAGAGAA 
GGTTATGAAG TAGTGCTGGT AAATTCAAAC CCAGCCACCA TAATGACAGA TGAACAGCTT 
GCCACTAAGA CTTACATAGA ACCATTGAGC GTTGAAGTGC TTGAGGAGAT TATAAAAAAA 
GAACGCCCAG ATGTCTTACT ACCTACCTTA GGAGGGCAAA CGGCTTTAAA CTTAGCAAAG 
GATTTATATG AATCGGGCAT ATTAGAAAGA TATGGTGTAG GAATAATAGG TGCCAACTAC 
GAGGCTATCA AAAAAGGTGA AGACAGGGCT CTTTTTGCAA AAGCTATGGA GGAGATAGGT 
CTAAAAGTTC CACCAAATGC CATAGTAAAT TCTATCTCAG AAGGTATGGC CTCTATAAAA 
GATATAGGAT TTCCAGCTAT ATTAAGGCCA GCTTTTACAC TTGGCGGGAC AGGGGGTTCT 
ATCGTTTACA ACTTAGAAGA GTTTCCAGCT AAGCTAAATG CTGCTTTAGA AGCCTCTCCT 
ATACATCAGG TGCTTATAGA CAAATCTCTT ATAGGATGGA AGGAGTTTGA GCTTGAAGTC 
ATAAGAGACA CAAAAGACAA CGTCGTTATA GTTTGTTCTA TAGAAAACTT TGATCCTATG 
GGTGTTCATA CTGGAGACTC TATAACAGTA GCACCAGCCC AAACCCTAAC CGATAAACAA 
TATCAGATGT TAAGAGATGC AAGCCTTGCC ATTATAAGAA AAATAGGTGT TGATACCGGA 
GGCTCAAATA TCCAGTTTGC AGTAGACCCA AACAGCGACA ATTTTTACGT GATAGAGATG 
AACCCAAGGG TTTCAAGAAG CTCAGCCTTG GCTTCTAAGG CCACTGGTTT TCCCATAGCA 
AAAGTAGCTG CCCTTCTGGC GATTGGATAT ACCCTTGATG AGATAAAAAA CGACATTACA 
AAAAATACGC CTATAAGCTT TGAGCCAAGC ATAGATTATG TTGTAGTAAA AATACCAAGA 
TTTGATTTTG CAAAGTTTAA AGAATCAAGC AAAATTCTTG GTACCACCAT GAAATCTGTG 
GGCGAAGTGA TGGCTATAGG AAGAACTTTT AAAGAAGCTT TCATGAAAGC CATAAGAAGT 
TTAGAAACCG ATAATCCATA TCTCTTTATG AAAGATTACG AAGCGCTTTC TTACGATGAG 
CTTCTTACAA ACATAAGGAT ACCAACACCA GAACGTATTT TTTATATAAA AGAAGCGTTT 
ATGAGGGGTA TAAGCATAGA AAAAGTGAAT GAAGTAAGCC ACATAGACAA ATGGTTTTTA 
CATCAGATAA AAGAGCTTGT AGAGGCTTAC AAACAAGATA TACCTTTTGA TAAAGATTAT 
ATATTTGAGC TAAAAATATT GGGCTTTTCA AATAAAGAAA TAGCTAAAAA GTTTAACAAG 
ACAGAAAAAG AGATAGAAGA GCTTTTGGAA GGTCTTATGC CTACTTTTAA AGCGGTGGAC 
ACCTGCGCGG GGGAGTTTAG GGCTTATACG CCTTATTATT ACTCCTCTTG GGAATATCCA 
TACTATAAAA TCGGGCAAGA AGAAGCTATT TTTGACAACG ACTAA

Protein sequence

MPKNTNIKKI LIVGAGPIII GQAAEFDYSG TQACKALMRE GYEVVLVNSN PATIMTDEQL 
ATKTYIEPLS VEVLEEIIKK ERPDVLLPTL GGQTALNLAK DLYESGILER YGVGIIGANY 
EAIKKGEDRA LFAKAMEEIG LKVPPNAIVN SISEGMASIK DIGFPAILRP AFTLGGTGGS 
IVYNLEEFPA KLNAALEASP IHQVLIDKSL IGWKEFELEV IRDTKDNVVI VCSIENFDPM 
GVHTGDSITV APAQTLTDKQ YQMLRDASLA IIRKIGVDTG GSNIQFAVDP NSDNFYVIEM 
NPRVSRSSAL ASKATGFPIA KVAALLAIGY TLDEIKNDIT KNTPISFEPS IDYVVVKIPR 
FDFAKFKESS KILGTTMKSV GEVMAIGRTF KEAFMKAIRS LETDNPYLFM KDYEALSYDE 
LLTNIRIPTP ERIFYIKEAF MRGISIEKVN EVSHIDKWFL HQIKELVEAY KQDIPFDKDY 
IFELKILGFS NKEIAKKFNK TEKEIEELLE GLMPTFKAVD TCAGEFRAYT PYYYSSWEYP 
YYKIGQEEAI FDND