Gene Saro_3589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3589
Symbol
ID	5077738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	209439
End bp	210644
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	66%
IMG OID	640481313
Product	plasmid replication initiator protein-like protein
Protein accession	YP_001165975
Protein GI	146275815
COG category	[L] Replication, recombination and repair
COG ID	[COG5534] Plasmid replication initiator protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGCA ACCGCCCTGC CCCCTCCGGC GACCAGTTCG ACCTGTTCCT GCCATACGTG 
GCGGACATGC CGATGCGCGA CCAGCGCGAG ATGATGGAAC GTCCGTTCTT CAGCCTCGCC 
AAGTCGAAGC GCGTGAAGCC GATCGACTAC ACCTCCCCTG ACGGCAAGCT GTGGGTGCAC 
GTATCGGGTA ACCCCGACTA TGGGATGGCG ACGATCTGGG ACGCCGACAT CCTGATCTAT 
TGCGCGAGCG TGCTGGCCGA CATGGCCCGG CGCGGGGTAA ACGACGTGCC GCGCAAGCTG 
CACCTCATGC CCTACGACCT GCTGCGCGCA ATCGGCCGGC CGACGACGGG GCGCGCCTAC 
GAATTGCTCG GCCAGGCGCT CGACCGCCTT GTCGCCACCA CGATCAAGAC CAACATCCGC 
GCAGAGAACC GGCGCGAGGC CACATTCTCG TGGCTCGATG GCTGGACCCA GCTTGTCGAT 
GAAAAGACCG AGCGTTCGCG CGGGATGACG ATCGAGCTGT CCAACTGGTT CTGGGAAGGC 
GTGATGATGA AGGGCGGGGT GCTCTCCATC GACCGCGCCT ACTTCGACAT TACCGGCGGC 
CGCGAACGCT GGCTCTACAA GGTCGCGCGC AAGCACGCCG GCGGGGCAGG GGAGGAGGGC 
TTCGCGATCT CGATGCCGGT GCTCTTCGAG AAATCGGGCG CGGAAGGCGA GTACCGCCGC 
TTCAAGTTCG AGATCCTGAA GCTGGCCGAA AAGAACGCGC TGCCGGGCTA TGGCCTGTCG 
GTCGAAACCG CCAGGGGAGG CGAACCCATG CTGCGCATGC GGCGGGTCGA CGGCAAGGAC 
GGCGCGGACC GGGCATTGCC CGAAGCGGGA CGACAAGGAG CCGAAGCCCG TACCGTGGCG 
AGCACGGCAC CCGATGTTTC CCCGGGGAAA CATTCTTCCG GAGCTAGCGA AACGGTCGAC 
GTGCGCGCGC TGATCCGCAA GACCGTGGCT GGCGTCAGCG ACGCCGCGAC GCGGGGCTTC 
ATGACCGACG AGACGATCCG GCACTTGCGC GAAACCTGCC CGGGCTGGGA TCTCCATGCG 
CTGCACGCCG AGTTCGAAAG CTGGGTGAAC GGCGACTCTG CACGGCTTCC GGCTAACTGG 
CAGAAGGCCT TCATCGGCTG GGTGAAGCGC CACCACGAAA AGAACGGCCA CGCGCTGCGG 
CGCTGA

Protein sequence

MSRNRPAPSG DQFDLFLPYV ADMPMRDQRE MMERPFFSLA KSKRVKPIDY TSPDGKLWVH 
VSGNPDYGMA TIWDADILIY CASVLADMAR RGVNDVPRKL HLMPYDLLRA IGRPTTGRAY 
ELLGQALDRL VATTIKTNIR AENRREATFS WLDGWTQLVD EKTERSRGMT IELSNWFWEG 
VMMKGGVLSI DRAYFDITGG RERWLYKVAR KHAGGAGEEG FAISMPVLFE KSGAEGEYRR 
FKFEILKLAE KNALPGYGLS VETARGGEPM LRMRRVDGKD GADRALPEAG RQGAEARTVA 
STAPDVSPGK HSSGASETVD VRALIRKTVA GVSDAATRGF MTDETIRHLR ETCPGWDLHA 
LHAEFESWVN GDSARLPANW QKAFIGWVKR HHEKNGHALR R