Gene Saro_3982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3982
Symbol
ID	5077512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	+
Start bp	147458
End bp	149788
Gene Length	2331 bp
Protein Length	776 aa
Translation table	11
GC content	63%
IMG OID	640481088
Product	Type IV secretory pathway VirD4 components-like protein
Protein accession	YP_001165750
Protein GI	146275589
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID	[TIGR02759] type IV conjugative transfer system coupling protein TraD

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCGTC CTGACACCTG GTCCGATCAG GCCCGCCCCG GCCAGCTCAA GCACCATTCG 
GCGCGCGGGA ACATGCCGCG CAACGCGGGC AATTTCACTC GCGGCTCGCA GCTCATCACG 
CACGAATTCC TGATGTGGTT TTCCTCGGCG AAGATGCCGC TGCTGGTGTG GTTCTTCACG 
TTCCTGATCG CGCTCTCGAT CGTCCTCGCG CTGCTGCTTC ACGAGCATGA AGTGCAGATG 
ATCCTGATGC GGATCTATGC GGAGGGATGG AGCTTCATGG AGTTCAGCCC GCGCAAGATC 
CTCAACCTAA CCTTGCCCTC CGGCCGCGTG ATCCCTGCCC CCGTTTCGAT GATCGCCAGC 
CACCCTGATG TCGTCATCGC CTGGAACAAG CTGATGCGCG CAATTTGGGG TTCGCTGTTC 
ATCTCGCTGT TCGTCGCGGT GCCGCTTTCG GTCTGGTTCA TCGACCTCTC GCGCAAGCGC 
GGCAAGGCGA TCCTCGAAGA ACGCCACCAG CGCGGCGCGA TGCTGGTCGA CGCCAAGGAG 
CTTGCCGCCG TGATCAACCA GCACAACAGC GCCGCGCTTG CCCAGGAGAT TGCCGAACGG 
ATGCCCGGCA AGACCATGGA CGACGTCATG AAAATGAGCT TTGCCGAGCG CAAGGCCGCC 
GGCATCCACC ACGTCTACAA CATCGCCGGC GTATCGTTTC CGTGGCGGAG CGAACAGGCT 
CACACGATCA TGATCGGGTC GACCGGGACC GGCAAGACCA CGCAGATGCG GGACATGATC 
GCGCAGATGC GCGTGCGCCA GGATCGGGCG GTCGTGTTCG ATCTTACCGG GGCCTACGTC 
GAGGCGTTCT ATAACCCCGA GACCGACACG ATCCTCAACC CGATGGACGA GCGCTGCCCG 
AGCTGGTCGC TGTTCGACGA GGGCAAGAAC TACGCCGACT TCACCGCGAT CGCATCAGCC 
ATCTTGCCGA CCGACGGCGG CGGCTCGGAC CCCTTCTGGA TGCTGGGAGC AAGGACATTG 
TTTGTGCAGA CCTGCGTCCA GCTCATGAAG CTCGGCCAGG CGACCAACGC CGCACTCGCC 
TACCGGCTGA TGATGGCCGA CCTTGAAGAG GTCCACGAAC TGCTTCGCAA TACCATTGCC 
GAGCCGCTGA CCGCGCCAGT CGCGGCGCGC ATGGCCGAGT CTGTCCGTGC AGTTCTCAAC 
ACCAATGCCC AGGCCTTGTT GTTTATTCCC GAAGGCAAGG AACCCTTCTC GATTTGCGAC 
TGGATTCGCC ACCAGGACAA GCCGGGCTCG ATCCTGTTCA TTACCTCTTC GCATAACGAA 
CTGGTGCTCA ACCGGGCGCT CTTGTCGCTG TGGATGAACC TTGCGGTGCA TACCCTGATG 
CGGCTGCCGC GCACCCGGTC ATTGCGCACC TGGTTCTTCT TCGACGAAGT CCATGCGCTG 
CACCGCCTGC CAGCGATCGA AGACGGCTTG CAGACTGCGC GCGGCTTTGG CGGCGCCTTC 
GTGCTCGGCA TCCATTCCTT CGCCAAGCTA GCCGAGACCT ATGGCAAGGA AGGCGCGCAG 
AACCTTGCCT CGCTGGCCCG CACCAAGCTG ATCCTGGCAG CGGCCGATCG CGACACCGCC 
GAGCACTGCT CGGACTACAT TGGTCACCGC GAAGTGCGGA TGATGGATGA GGCCTACAGC 
TACGGCTATT CCAACATCCG CGACGCCGCG ACCATTACCC CGCGCTCGGA AGTGCAGCCG 
CTGGTGATCC CCGATGACAT CATGCGCCTG CCTTCGCTGC GCGGGTTCCT GGTCTTTCCG 
GAAGGGTTCG ATGCGGCGCG GATCAGGCTC ACCTACAAGG ACTACCCCAA GGTCGCAGAG 
GGCTACATTC TGCGCGAGAA CGTCGAGCCT ATCGAGTTCA TCTCCATGCC CAAGGGTGAC 
GATGAAGTCG CCGAGACCGG CGGCCGGGAC CGCAGCGGCG AACCGGAACT GGAGCCGCGC 
GGCGAAGACC TTGGGCGCGA CCCCGCAGTG CCGTTGTCAC CGGCGCTCGA GCCCGACGCC 
AATGCGCCGG AAATCATGCC CGATGGACCA AATCCTGATC CCAGTGTCGG CAAGCAGATG 
GCATTTCGTC TGGAGCAAGC GCCTCAGAAC GAACGCACCA ATAGCCGCGA GCAGGACCCG 
AGTCAGAAGG CTGAAAAGAG TTCCGCGTCC AAGCCTGCCG CGCAGCGCAC CGTCGGGTCC 
CGCGAACTCA ATGACCCCGC CATCCCCGAC AAGGAATCTG AGCGCGGCGC GAAGACCGCC 
AAGGGGATCG AGGACCAATC GCATTCCCGT GACGACGGAC CGGAGCTCTA G

Protein sequence

MRRPDTWSDQ ARPGQLKHHS ARGNMPRNAG NFTRGSQLIT HEFLMWFSSA KMPLLVWFFT 
FLIALSIVLA LLLHEHEVQM ILMRIYAEGW SFMEFSPRKI LNLTLPSGRV IPAPVSMIAS 
HPDVVIAWNK LMRAIWGSLF ISLFVAVPLS VWFIDLSRKR GKAILEERHQ RGAMLVDAKE 
LAAVINQHNS AALAQEIAER MPGKTMDDVM KMSFAERKAA GIHHVYNIAG VSFPWRSEQA 
HTIMIGSTGT GKTTQMRDMI AQMRVRQDRA VVFDLTGAYV EAFYNPETDT ILNPMDERCP 
SWSLFDEGKN YADFTAIASA ILPTDGGGSD PFWMLGARTL FVQTCVQLMK LGQATNAALA 
YRLMMADLEE VHELLRNTIA EPLTAPVAAR MAESVRAVLN TNAQALLFIP EGKEPFSICD 
WIRHQDKPGS ILFITSSHNE LVLNRALLSL WMNLAVHTLM RLPRTRSLRT WFFFDEVHAL 
HRLPAIEDGL QTARGFGGAF VLGIHSFAKL AETYGKEGAQ NLASLARTKL ILAAADRDTA 
EHCSDYIGHR EVRMMDEAYS YGYSNIRDAA TITPRSEVQP LVIPDDIMRL PSLRGFLVFP 
EGFDAARIRL TYKDYPKVAE GYILRENVEP IEFISMPKGD DEVAETGGRD RSGEPELEPR 
GEDLGRDPAV PLSPALEPDA NAPEIMPDGP NPDPSVGKQM AFRLEQAPQN ERTNSREQDP 
SQKAEKSSAS KPAAQRTVGS RELNDPAIPD KESERGAKTA KGIEDQSHSR DDGPEL