Gene Haur_4076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4076
Symbol
ID	5735934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5202352
End bp	5203932
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	54%
IMG OID	641281227
Product	phosphoenolpyruvate carboxykinase
Protein accession	YP_001546836
Protein GI	159900589
COG category	[C] Energy production and conversion
COG ID	[COG1866] Phosphoenolpyruvate carboxykinase (ATP)
TIGRFAM ID	[TIGR00224] phosphoenolpyruvate carboxykinase (ATP)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAC GAGCCGTATT AAGTGAAGGC GACACTGTAG GCGCTAATTT ACATGTCAAG 
CAAGCCTATC GCAACTTAAC GGTGCCGCAA TTGGTGGAAG CTGCTCTCAA ACGGGGCGAA 
GCCGTTTTAT CGGCTACTGG GGCTGTCGTT GCCACCACGG GCGCACGCAC GGGTCGTTCT 
GCAGATGATA AGTTTGTGGT GGAAACACCA GCAGCCGCGT CAATGCACTG GACGAAATTC 
CATAAAGCTA TGAAGCCCGA AACCTATGCC ACGATCAAGG CCAAGGCGTT GGCACACATG 
GCCGAACGTG AGATGTTTGT TTTAGATGCT AGCGCTGGGG CTGATCCAGC GTATGCGTTG 
CCAATTCGCG TGGTGACCGA GTATGCTTGG CATAACTTGT TCGCTAAGCA ATTGTTCCGC 
GATGCGATCA GCAGCGATCA ACAACCGCAA TGGACGGTGC TCAACTTGCC AAGTTTGAAG 
CTTGATCCAG CGGTTGATGG CTCGCGCTCA GAAGTTGCCG CCATGATCAA TCTCGATGAA 
AAATTGATTT TGATTGTCGG TACTGAATAC GCTGGCGAGA TCAAGAAATC GATCTTTACG 
GTATTGAACA TGGTGCTGCC AAGCCAAGGC GTGATGCCAA TGCACTGTTC AGCCAACATT 
GGCAGCAAGG GCGATGTAGC CTTGTTCTTC GGGCTTTCGG GCACGGGCAA AACCACGCTC 
TCAGCCGACC CCGAACGGAT TTTGATTGGC GATGATGAGC ATGGTTGGAG CGCCAACGGC 
GTGTTCAACT TTGAAGGCGG CTGCTATGCC AAGTGTATTC GCTTGCGCCG CGAATCGGAG 
CCAGAAATTT TCGACGCAAT TCGCTATGGG GCGGTGCTCG AAAACGTGGT GCTCAGCGAT 
AGCCGCGATC CCAATTATGA TGATGCGTCG TTGACCGAAA ACACCCGCGC TGCCTATCCC 
TTGGAATACA TTCCCAACGT CAGCGAAACG GGTATGGGCG GCCAACCAGA AACGATCATC 
TTCTTGACCG CTGATGCCTT TGGAGTTTTG CCGCCAATCG CCAAACTCAG CCCTGAACAA 
GCGATGTATC ACTTCTTGTC GGGCTATACC GCCAAGCTGG CTGGCACCGA AACGGGCGTT 
GGCTCAGAGC CACAAGCAAC GTTTAGCACC TGCTTTGGCG CACCGTTTAT GCCTTTGCAC 
CCAACTGTGT ATGCCGATTT GCTTGGCCAA AAAATGCGCG AACACAAAGT CCGTGTATTT 
TTGGTCAACA CTGGCTGGAC TGGTGGTTCG TTCGGGGTTG GCAAGCGCAT GAGTTTGCGC 
GATACCCGCA CGATGGTGCA TGCCGCCTTG GCTGGCAAAC TCGATGCTGT GGAAATGTGG 
CACGATGAGC GTTTCAATCT CGATGTGCCT GTGGCAATCG AAGGCGTTGA TAACAGTGTG 
CTGCAACCCC GCCAAACTTG GGCCGATGCC AGCGAATACG ATCGGGTTGC CGATGACTTG 
GCCGCCCGCT TCCGCAAGAA CTTCGAGCAA TACGCCGAAC GCGCTGGCGA AACCGTGGTA 
AACGCCGGCC CACAAGCGTA G

Protein sequence

MTERAVLSEG DTVGANLHVK QAYRNLTVPQ LVEAALKRGE AVLSATGAVV ATTGARTGRS 
ADDKFVVETP AAASMHWTKF HKAMKPETYA TIKAKALAHM AEREMFVLDA SAGADPAYAL 
PIRVVTEYAW HNLFAKQLFR DAISSDQQPQ WTVLNLPSLK LDPAVDGSRS EVAAMINLDE 
KLILIVGTEY AGEIKKSIFT VLNMVLPSQG VMPMHCSANI GSKGDVALFF GLSGTGKTTL 
SADPERILIG DDEHGWSANG VFNFEGGCYA KCIRLRRESE PEIFDAIRYG AVLENVVLSD 
SRDPNYDDAS LTENTRAAYP LEYIPNVSET GMGGQPETII FLTADAFGVL PPIAKLSPEQ 
AMYHFLSGYT AKLAGTETGV GSEPQATFST CFGAPFMPLH PTVYADLLGQ KMREHKVRVF 
LVNTGWTGGS FGVGKRMSLR DTRTMVHAAL AGKLDAVEMW HDERFNLDVP VAIEGVDNSV 
LQPRQTWADA SEYDRVADDL AARFRKNFEQ YAERAGETVV NAGPQA