Gene Saro_0359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0359
Symbol
ID	3918243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	395159
End bp	396898
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	66%
IMG OID	640443088
Product	hypothetical protein
Protein accession	YP_495641
Protein GI	87198384
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3843] Type IV secretory pathway, VirD2 components (relaxase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGACG ACTTCGAGAT CCGTCCCGGC CGATCGCGGG ACCAGGGCAT GCCGGCCAGC 
CGCAAGGCGA CCTCGCTCGT CGGCCAGGTG CTCAAAGCGT CGCGCCGCTC CGGGGCAACG 
CCACTGGCTC GCCGGAGCGG CAAGCCTGCC GGGACGGGAA GATATGGCCG GGGCCGCGCA 
GCCGCACTGC GCGCGCGGCG TTCGCCCTAC CAGCGCCGCG TGGTGATCAA GGCGCGCGTC 
GTGCGACACA AAGGCGCGCG GTTCCGGGCC GCGCCGCTTG CGATGCACGT CTCCTACCTC 
GAGCGCGATG GCGTGACGCG CGACCAGGAG CGCGGTCAGC TCTTCGATGC CGGCGTGGAC 
AATGCCGATG GCGAGGCATT CGCGCAACGC TGCGCGGATG ACCGGCACCA TTTCCGGTTC 
ATCGTGTCAC CCGAAGATGC GACCGAGCTT GCCGACCTGC GCACGTTCAC TCGCGAGCTG 
ATGGATGACA TGGCCCGCGA TCTCGGCACC CGGCTCGTCT GGGTCGCGGT GGATCACTGG 
AACACCGACA ACCCTCATGT TCATGTCCTC GTCCGGGGGC GGGCAGCGGA TGGCGCGGAC 
CTGGTCATCG ACCGCGACTA TATTCGTGAG GGCATGCGCT CACGGGCCGA AGAGCGCGTC 
ACCATCGAGC TCGGGCCGCG GAGCGAACGC GACATCCAGC GCGCCATGGC TCGTGAGGTC 
TCAGCGGAAC GGTGGACAGG CCTCGACCGG CAACTGCGCA CGCTGCAGGA TCACGACCAG 
GTGATCGATC TGCGCCCAGC AGCGGATCAG GATCGCCGGC GCCATGCGCT GCTTGTAGGC 
AGGGTCAACT CGCTGGCACG CATGGGGCTG GCGAGCGAAA CCCAGCCAGG GCGCTGGACG 
ATGCGCGCCG ATGCGGAGAA GACGCTGCGC GACCTCGAAA TCCGCGGTGA TGTCATCAAG 
ACGATCCACC GCTCGATGGC GGAGAACGGA TGGCGCTCAG ACCTGTCCCG GCTTGCGATT 
CACGACCAGC AGCCATCGGA TCCGATCATC GGCCGACTGG CCAGCAGGGG GCTTCACGAC 
GAGCTATCAG GCAAGGCCTA TGCCGTCGTC GATGGCATGG ATGGTAGGAC ACATCACCTG 
CGTTTCAACG ATCTCGAAGC CACCAGCGAT GCCCGGCCCG GCGCGATCGT GGAACTGCGG 
CATTGGACCG ATCGCAAGGG ACAAGGCCAT GCCGCGCTGA CGGTCCGTTC GGATCTGGGA 
TTGGCGGAAC AGGTCACGGC CAAAGGAGCG ACGTGGCTCG ACCAGCAACT CGTGGCGAAG 
GAGCCGACGG CACATGGGCC AGGCTTCGGG CGGGAGGTCG AGGAAGCCCT GCAACAACGC 
TCCGAGCATC TGGCTGATGA TGGACTGGCA ACCCGGCAGG GGCGGCGGTT TCTGTTTGCG 
CGCGGTCTTC TCGAGACCTT GCGTCAGGGA GAGATGGCCG AGGCGGCGAA CAGGCTCTCC 
CGGCAGACCG GGCTTGAGTT GCAAGCGAGT GGACCCGGGG AGCATGTCGC CGGCATTTAC 
AGGCAGCGTG TCGACCTGGC GTCGGGTCGC TTCGCCATGA TCGACAATGG TCTGGGGTTC 
CAGCTAGTGC CCTGGCAGCC AGTATTGGAG CGCAAACTTG GCCAGGCCGT GGCTGGTGCG 
GTGGACCAGC GCGGAGGGGT CGACTGGAGT TTTGCGCGGT CGAGGTCGAT TTCCCTTTGA

Protein sequence

MDDDFEIRPG RSRDQGMPAS RKATSLVGQV LKASRRSGAT PLARRSGKPA GTGRYGRGRA 
AALRARRSPY QRRVVIKARV VRHKGARFRA APLAMHVSYL ERDGVTRDQE RGQLFDAGVD 
NADGEAFAQR CADDRHHFRF IVSPEDATEL ADLRTFTREL MDDMARDLGT RLVWVAVDHW 
NTDNPHVHVL VRGRAADGAD LVIDRDYIRE GMRSRAEERV TIELGPRSER DIQRAMAREV 
SAERWTGLDR QLRTLQDHDQ VIDLRPAADQ DRRRHALLVG RVNSLARMGL ASETQPGRWT 
MRADAEKTLR DLEIRGDVIK TIHRSMAENG WRSDLSRLAI HDQQPSDPII GRLASRGLHD 
ELSGKAYAVV DGMDGRTHHL RFNDLEATSD ARPGAIVELR HWTDRKGQGH AALTVRSDLG 
LAEQVTAKGA TWLDQQLVAK EPTAHGPGFG REVEEALQQR SEHLADDGLA TRQGRRFLFA 
RGLLETLRQG EMAEAANRLS RQTGLELQAS GPGEHVAGIY RQRVDLASGR FAMIDNGLGF 
QLVPWQPVLE RKLGQAVAGA VDQRGGVDWS FARSRSISL