Gene Phep_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2053
Symbol
ID	8253157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2369493
End bp	2370779
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	40%
IMG OID	644935701
Product	citrate synthase I
Protein accession	YP_003092320
Protein GI	255531948
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01798] citrate synthase I (hexameric type)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.655097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0360596
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGATA TTGCAGAAAT TAAGATTGAT GGAAAAGTGT ATGAATTCCC CGTTATCACT 
GGAACCGAAG GGGAGAAAGC TATAGATATC TCTAAACTTA GAGATTTAAC AGGTCATATC 
ACTTTAGACT TTGGATACAA AAATACGGGC TCTACCAAAA GTGCAATAAC CTTTTTGGAT 
GGTGAACAAG GTATATTAAA ATACCGTGGC TATCCGATTG AAGAACTGGC AAAAAAATCT 
ACTTTCTTAG AAGTAGCCTA TTTATTGATA TATGGCGACC TGCCCACACA GGTGCAATTG 
GATGATTTTC AAAAACAGAT CAGCAGACAT ACACTGATCC ATGAGGATAT GAAGAAATTT 
CTGGATGGTT ATCCGTCGAA ATCACATCCT ATGGCCCAGC TCTCTTCACT GGTATGTTCT 
TTATCTACTT TCTACCCGGA GTCTTTAAAT GCAAATTCAT CGCCTGAGAC GATGGACCTG 
ACCATGATCA AACTGCTGGC CAAGTTTCCG ACCATTGTTT CTTTCATATA TAAAAAATCT 
TTAGGCCACC CGCTGATCTA TCCTAAAAAT AAATACGATT ACATCAGCAA TTTCCTGAAC 
ATGATCTTTG GTCAGCGTAC AGAGGAAGTT GAGATTGACC CGGTTGTGGT AAATGCCATG 
AACACCTTAT TGATCTTACA TGCAGACCAT GAACAGAATT GTTCTACCTC TACAGTAAGG 
ATTGTTGGTT CTTCAGATTG TAACTTGTAT GCATCGGTTT CTGCAGGTAT AGACGCCTTA 
TGGGGGCCAC TTCATGGCGG CGCGAACCAG GCAGTAATAG AGATGCTGGA ACTAATTAAA 
CAAGATGGCG GGGATACAGA AAAATGGATC AATAAAGCCA AAGATAAAAA TGATCCTTTC 
CGTATGATGG GTTTTGGGCA CAGGGTATAT AAAAACTTTG ATCCAAGGGC TAAGATCATT 
AAAAAGGCTT GTGATGATAT TTTAGAAAAA CTGGGCATCA ACGATCCGGT ACTGGAAATT 
GCCAAGAAAC TGGAAGAAGC AGCTTTAAGC GATCCTTATT TTGTACAACG TAAACTATAT 
CCTAATGTCG ACTTCTACTC GGGGATCATT TACAGGGCTT TAGGTTTCCC TACGGATATG 
TTTACTGTAT TGTTTGCTTT GGGCCGTTTA CCGGGATGGA TTGCACAATG GAAAGAAATG 
CATGAAAACA AAGAGCCGAT AGGACGCCCG CGCCAGATTT ACGTTGGTCA TACCGACAGA 
ACTTTTACTG CAATAAAAGA CAGGTAA

Protein sequence

MSDIAEIKID GKVYEFPVIT GTEGEKAIDI SKLRDLTGHI TLDFGYKNTG STKSAITFLD 
GEQGILKYRG YPIEELAKKS TFLEVAYLLI YGDLPTQVQL DDFQKQISRH TLIHEDMKKF 
LDGYPSKSHP MAQLSSLVCS LSTFYPESLN ANSSPETMDL TMIKLLAKFP TIVSFIYKKS 
LGHPLIYPKN KYDYISNFLN MIFGQRTEEV EIDPVVVNAM NTLLILHADH EQNCSTSTVR 
IVGSSDCNLY ASVSAGIDAL WGPLHGGANQ AVIEMLELIK QDGGDTEKWI NKAKDKNDPF 
RMMGFGHRVY KNFDPRAKII KKACDDILEK LGINDPVLEI AKKLEEAALS DPYFVQRKLY 
PNVDFYSGII YRALGFPTDM FTVLFALGRL PGWIAQWKEM HENKEPIGRP RQIYVGHTDR 
TFTAIKDR