Gene Rmar_2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_2114
Symbol
ID	8568775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	-
Start bp	2469143
End bp	2470948
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	68%
IMG OID
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_003291382
Protein GI	268317663
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCCCC TGCTGCTGCC GGGCACGGTC TGGCTCGACA CCGCCCAGCC GGACGAAGAA 
AACCGCCGGA GTCTGCTGTT CATGCGGCCG GTCCGGGTGC TGCAGGCCGA CACCCCGGAG 
CAGGTGCCAG CGCTGCTGCG GGCGCTCGAC GGTGCCGTCG CGGCCGGTTA CTACGTGGCC 
GGCTACATGG CCTACGAGGC CGGCTATGCG CTGGCCCCCG TGCCGCTTCA GGTGCCTGAC 
GAAACCGGAC CGCTTGCCTG GTTCGGCGTC TATGAAATGC CGCACGTGCT GGCACCGGCC 
AGTACAGCCG CGCTGGCAGG GAAGACCGGC GATTATGCCG TGCGGGATCT GCACCTGGCG 
CTTTCGCGCG AGGCCTATCG CGAGCGCGTG CAGCACATCC GCGCACTGAT CCGGGAAGGC 
GAAGTCTATC AGATCAACTT CACGCTGCCG CTGCGTTTTC GCTTCGAGGG CGATCCGATC 
GCGTTTTTCC TGGCCCTTCG GCGCCAGCAA CCGGTTCCCT ACGCCGCCTT TGTCAACACG 
GGCGAGCGGC TGGTGCTGAG CCTCTCGCCA GAGCTTTTCT TCCGGCGCAA CGGCGAACAG 
ATCTATACGC GTCCGATGAA AGGCACGGCG CGGCGTTCGT CGCTCCCGGA GGAAGATGCC 
CGGTTGGCCG AGGCGTTGCG CACCGACGAA AAGAACCGGG CGGAAAACCT GATGATCGTC 
GATCTGCTGC GCAACGACCT GTCGGTCTGC TGCGAGCCGG GTTCGGTGGC GGTCTCCGAG 
CTGTTTCGCG TCGAAGCCTA TCCGACGGTC TGGCAGATGA CCTCGACGGT AACGGGACGG 
CTTCGGTCCG GGGTGGGCTA TGCCGAGCTG TTCCGGGCGC TGTTTCCGTC GGGGTCCGTG 
ACCGGCGCGC CCAAGCTCCG GGCCATGCAG CACATTGCAC GGCTGGAACC GGCTCCGCGG 
GGGGTCTACT GTGGCGCGAT CGGCTATGCG GCACCGGACG GCGAGGCGGT GTTCAACGTG 
GCCATCCGCA CGCTGGAGCT GGCCGGATCG GAAGGGCGTA TGGGCGTGGG CAGCGGGATC 
GTGTGGGACT CCGATCCGGA CGCGGAATAC GAGGAGTGCT GGCTGAAGGG GCAGTTTCTG 
CGGGCGGCCG CCGAGCCGTT TGCGCTGATC GAAACGATGC GCTGCGAACA GGGGCGCATT 
CCGCTGCTGG AACTGCACCT GGAGCGTCTG CGCCGGTCCG CCGCGCATTT CGGGTTTGCG 
CTGGACGAAG GGCGGGTGCG GGCCCAGCTG GAGCAGGTGC AGCAGGCGCT GGACCCTGCG 
AAGGTGTGGC GGTTGCGTCT GACGCTGGAG GTTTCGGGCC AGACGCAGCT GACCACCGCC 
GAGCTCGAAC CGGAGCCGGA TCGACCCTGG CGGCTCTGCG TGGCGCGGGA GCGGCTGGAC 
CCTTCCGATC CGCTGCGCTA CCACAAGACG ACGCGCCGCG CGCACTACGA GGCGGCCTAC 
CTGCAGGCGC AGGCGGCCGG CTTCGACGAG GTGCTGTTTC TGAACACGCG GGATGAGGTC 
TGCGAGGGTT CACGCACCAA CCTGTTCGTG CAGCTCGACG GGCGGCTCTA CACGCCGCCG 
GTTTCGTGCG GACTGCTGCC CGGGGTGTAC CGGCAGCACG TGCTGCGCAC GCGTCCGGAT 
GTCGAAGAAC GGGTGCTGAC GCTGGCCGAT CTGCGCCGGG CCGAGGCGCT CTACGTATGC 
AATGCCGTGC GCGGCTGGCG ACCGGCCGTG CTGGCGGTGC CCGAACCGGT GCTCACAACG 
CTCTGA

Protein sequence

MHPLLLPGTV WLDTAQPDEE NRRSLLFMRP VRVLQADTPE QVPALLRALD GAVAAGYYVA 
GYMAYEAGYA LAPVPLQVPD ETGPLAWFGV YEMPHVLAPA STAALAGKTG DYAVRDLHLA 
LSREAYRERV QHIRALIREG EVYQINFTLP LRFRFEGDPI AFFLALRRQQ PVPYAAFVNT 
GERLVLSLSP ELFFRRNGEQ IYTRPMKGTA RRSSLPEEDA RLAEALRTDE KNRAENLMIV 
DLLRNDLSVC CEPGSVAVSE LFRVEAYPTV WQMTSTVTGR LRSGVGYAEL FRALFPSGSV 
TGAPKLRAMQ HIARLEPAPR GVYCGAIGYA APDGEAVFNV AIRTLELAGS EGRMGVGSGI 
VWDSDPDAEY EECWLKGQFL RAAAEPFALI ETMRCEQGRI PLLELHLERL RRSAAHFGFA 
LDEGRVRAQL EQVQQALDPA KVWRLRLTLE VSGQTQLTTA ELEPEPDRPW RLCVARERLD 
PSDPLRYHKT TRRAHYEAAY LQAQAAGFDE VLFLNTRDEV CEGSRTNLFV QLDGRLYTPP 
VSCGLLPGVY RQHVLRTRPD VEERVLTLAD LRRAEALYVC NAVRGWRPAV LAVPEPVLTT 
L