Gene Saro_3919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3919
Symbol
ID	5077403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	86362
End bp	87666
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	58%
IMG OID	640481026
Product	plasmid encoded RepA protein
Protein accession	YP_001165688
Protein GI	146275527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGAG ACACACTGCG TCCAATCGGA CATCAATACG CTCTAGCAAT GCTAGGCGGT 
GGTGAAGAGC GAGTCAGGTC ACTAGCGCAG TCTGCCGGCA CTCAGCTGAC CATGGATGCG 
TTTCTCAGGG TTCAGGATGA AGAGCCCGTA CCGGCATTTC TGCATTCAGC GCTTTGCGCG 
ATGTCCCTGC CCACGAAGCG GCCGAAGGAT GATACGCAAC CCATCCTTCG CGAAGACGGA 
AAGTATGCGC TGGCGATCAA CCCCAGGCCC ATATTGCAAA CCGTCGATGG CAAGCCGACA 
CTTCGAAGCC TCGGAGTACC GTATGGGGCC TATCCGCGCG TCGCGCTGAT CTATCTGCTG 
TCGCAAGCAG TCACGAAGCG TTCGCGCGAC GTCTACTTGG GTCGCAATTT CACTGAGTGG 
ATGCGCCGTC TTGGCTATCA GACAGTTTCC TATGGACCTC GCGGTACCGC CAATTTGATG 
AGGGAGCAGG TGGACCGGCT GCTTGCCTGC GAATGGCAAA TCCGCTGGGA GGGTAACGAG 
GGTGGGGACA ACGCATTCGC TGTTCGGGAT GTGAAGATTT CCAACGAGTA CGCCGGATCG 
CTTGAGAAAA ACGGCGCATT TGCGCGTGAA ATTCGGATGT CAGAGGCATT CTACAGCCAC 
CTGCTTGATC ATGCCGTACC GCTTAACGAG GTCGCTATTC GAGAGCTCAA GGGCACCCCA 
ACTGCGCTCG ACCTCTATAC CTACCTTGCG TATCGACTGC CACGGATCGG CAGTGACCGG 
GGGCAAGTAA TCTCCTGGGA TCAACTGGCC AAGCACTTGG GCAATGACGC CGACAGCAAG 
CGTTTCCGGC AAACCGTGCG AGAGACCATG CAGTTGGTTT CGGCGGTGTA TCCCAACGCA 
GATGTCGATT TCAGCGGTCG CAAGGTGGTG TTGCGACCTT CGCCAGCCCC ATTGGAGCGA 
AAGCTCGTCG GTCCGCACCT GCGTGTCATT GGTGCACCAG CGTTGGAAAC CGCACCGAGA 
TCATCGGTCC CGAAGATGGC TCGCACGCCC CTTCGCGAAA CGAAGACCAC CGAACCTCTG 
CAGCATTTTC CGGGCGGTAG CCTGACATAC GGCGACCGAG AGACGAAGTT TCGGGCGATC 
GGTCTCGATA AAGGTAAGCC GTGGTGTGTT GATACCATGG CAAACGCTTT TCGTGCGGGC 
TTCCCTGGCA TCAAGCAAGC GCGCACTGAT GCCGAGTGGC TCAGGGTCTG GGAGGCCTTC 
GTTATCAAAT ATGCTGACCG GCGCGCTCAG GCAGGCGCAA ACTGA

Protein sequence

MSGDTLRPIG HQYALAMLGG GEERVRSLAQ SAGTQLTMDA FLRVQDEEPV PAFLHSALCA 
MSLPTKRPKD DTQPILREDG KYALAINPRP ILQTVDGKPT LRSLGVPYGA YPRVALIYLL 
SQAVTKRSRD VYLGRNFTEW MRRLGYQTVS YGPRGTANLM REQVDRLLAC EWQIRWEGNE 
GGDNAFAVRD VKISNEYAGS LEKNGAFARE IRMSEAFYSH LLDHAVPLNE VAIRELKGTP 
TALDLYTYLA YRLPRIGSDR GQVISWDQLA KHLGNDADSK RFRQTVRETM QLVSAVYPNA 
DVDFSGRKVV LRPSPAPLER KLVGPHLRVI GAPALETAPR SSVPKMARTP LRETKTTEPL 
QHFPGGSLTY GDRETKFRAI GLDKGKPWCV DTMANAFRAG FPGIKQARTD AEWLRVWEAF 
VIKYADRRAQ AGAN