Gene Daro_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3098
Symbol
ID	3568495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3338260
End bp	3339558
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	61%
IMG OID	637681569
Product	isocitrate lyase
Protein accession	YP_286298
Protein GI	71908711
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	0.183218
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACTC GCGAACAGCA AATCGCCGCC CTCGAAAAAG ACTGGGCTGA AAACCCCCGC 
TGGAAAGGCA TCAAGCGCGG TTATTCCGCT GCTGACGTCG TCCGTCTGCG TGGTTCTTTC 
CAGGTCGAGC ACACCTTGGC CCGCCGTGGC GCCGAAAAGC TGTGGGATCT GGTCAACAAC 
ACCCCCTACG TCAACTGCCT GGGCGCCCTG ACCGGCGGTC AAGCCGTTCA GCAAGCCAAG 
GCTGGCATCA AGGCCATCTA CCTGTCCGGC TGGCAAGTTG CTGCTGACAA CAACGAATAC 
GCTGCCATGT ACCCGGATCA GTCCCTGTAC CCGGTTGACT CCGTGCCGAA GGTTGTCGAA 
CGCATCAACA ACTCCTTCAA CCGCGCCGAC GAAATCCAGT GGTCCAAGAA CATCAACGCT 
GGCGATGCCG GTCACGTCGA ATACCACCTG CCGATCGTTG CTGACGCTGA AGCCGGTTTC 
GGCGGCGTGC TGAACGCCTA CGAACTGATG AAGGCCATGA TCCGCGCTGG CGCTGCTGGC 
GTGCATTGGG AAGACCAGCT GGCTTCCGTC AAGAAGTGCG GCCACATGGG CGGCAAGGTT 
CTGGTTCCGA CCACCGAAGC TGTTCAGAAG CTGATCGCTG CCCGTATGGC TGCCGACGTC 
TACGGCGTGC CGACCCTGGT CATCGCCCGT ACCGATGCCG AAGCTGCTGA CCTGCTGACC 
TCCGACTACG ACGAGAACGA CAAGCCGTTC TTGACCGGCG AGCGCACCGC CGAAGGCTTC 
TACAAGACCC GCAAGGGCCT GGATCAAGCC ATCTCCCGCG CCATCGCCTA CGCTGACTAC 
GCCGATCTGG TGTGGTGCGA AACCGGCACG CCGGATCTGG AATACGCCCG CAAGTTCGCC 
GAAGCCGTGC ATAAGGTTCA TCCGGGCAAG ATGCTGGCCT ACAACTGCTC GCCTTCCTTC 
AACTGGAAGA AGAACCTGGA CGACGCCACC ATTGCCAAGT TCCAGAAGGA ACTGGGCGCC 
ATGGGCTACA AGTACCAGTT CATCACCCTG GCTGGCATCC ACTCCATGTG GTACAACATG 
TTCGATCTGG CCCAGGACTA CGCCGCCCGC GGTATGTCGG CCTACGTCGA GAAGGTTCAG 
GAGCCGGAAT TCGCTGCCCG CGACCGTGGC TACACCTTCG TGTCGCACCA GCAGGAAGTC 
GGTACCGGTT ACTTCGACGA CGTCACCACC GTGATCCAGG GTGGCAAGTC CAGCGTCACC 
GCGCTGACCG GCTCGACCGA AGAAGAACAG TTCCACTAA

Protein sequence

MSTREQQIAA LEKDWAENPR WKGIKRGYSA ADVVRLRGSF QVEHTLARRG AEKLWDLVNN 
TPYVNCLGAL TGGQAVQQAK AGIKAIYLSG WQVAADNNEY AAMYPDQSLY PVDSVPKVVE 
RINNSFNRAD EIQWSKNINA GDAGHVEYHL PIVADAEAGF GGVLNAYELM KAMIRAGAAG 
VHWEDQLASV KKCGHMGGKV LVPTTEAVQK LIAARMAADV YGVPTLVIAR TDAEAADLLT 
SDYDENDKPF LTGERTAEGF YKTRKGLDQA ISRAIAYADY ADLVWCETGT PDLEYARKFA 
EAVHKVHPGK MLAYNCSPSF NWKKNLDDAT IAKFQKELGA MGYKYQFITL AGIHSMWYNM 
FDLAQDYAAR GMSAYVEKVQ EPEFAARDRG YTFVSHQQEV GTGYFDDVTT VIQGGKSSVT 
ALTGSTEEEQ FH