Gene Saro_0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0244
Symbol
ID	3917595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	251857
End bp	253635
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	68%
IMG OID	640442971
Product	Type I secretion system ATPase, PrtD
Protein accession	YP_495526
Protein GI	87198269
COG category	[R] General function prediction only
COG ID	[COG4618] ABC-type protease/lipase transport system, ATPase and permease components
TIGRFAM ID	[TIGR01842] type I secretion system ABC transporter, PrtD family

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGCGGG ACTATCTTAA GTTGTTCGTT GCGCGATATC GTTCGTCGCT AGTGCTGGTG 
ATTGCCGCCA GCGTCCTGCT CAACCTTCTC GTTTTCGCCG GCACGATATA CATGATGCTG 
GTCTATGACT CGGTACTGCC GAGCCGCAGC ATCCCGACCC TTGTCGGCCT GTTCGCGATG 
ATCGTGCTGG TCTACCTGTT CCAGGCCCTG TTCGAGGCCA TTCGCGGCGA GGCGATGCTC 
TCGGTCGCCA ATGGCGTGCA TGACGATCTC TTTGCTGCCG TCCACCACGC CACGGTTTCG 
CGCCCCCTGC GCGCCGCCGC CGACAAGGGC GACGGTCTTC AGCCGATCCG CGATCTCGAT 
GCGATCCACA CGTTCCTTGC GGGGCCGGGG CCGACGGCGC TGATCGACCT GCCGTGGGTA 
ATCGTGTTCC TCTTCGTGCT GACTGCGTTG CACTGGTGGC TGGGGCTGAC GGCGCTGGTC 
GGGGTGATCG TGCTGTCCGC GATCGCGTTG TGGTCCAACC GGCGGACGGC GAGTGCGACC 
CGGCAATTGC AGTCGGTCAT CGGCCAGCGG TCCGCCTCGG CCCAGGCCGA GATCCGCAAT 
GCCGAGACGG CCGTCGCCAT GGGCATGCAG GAGCGCCTGC TGACCCGGAC GCGTGGCTGG 
GAAGCGGATT TTCTCGAATC GCAATCGCGC CTGTCGCGGC TTGTCTCGCG GTTCGGCGGG 
GCGGGGCGCA CGTTCCGCGT CTTCCTGCAA TCGCTGATCC TGACCGTGGG CGCGCTGCTG 
GTGATCGACG ACAAGGCCAG CGGCGGCGTG ATTCTCGCGT CCTCGGTGTT GTCCGGACGC 
GCGCTGGCGC CGGTCGATTC GGCAATCGCC AACTGGCGCG GCCTGGTCGC GGCAAGCACC 
GGCTGGGAGC GGATCGTCCA GCTCATCAAT GCCTTCCAGA AGGCACCGCC CCGCTCGATC 
GAGCTTGGCG CGCCCAGCGC CGAACTCTCG ATCCGCGACC TGTGGGTGGC CCCGCCGGGC 
GTCCAGCGCA TGACCGTGCA GGGCGCGGCC CTTTCGCTCA CCCCCGGCCA GGCGCTTGCG 
ATCATCGGGC CTAGCGCGGC CGGCAAGACC TCGCTGATGA AGGCCATGCT CGGCATCTGG 
CGCCCGCAGC GGGGCGAAGT CCGCCTCGAT GGCGCGACGC TCGACCAGTG GGCTGCCGAA 
AGCCTGGGCC GCCACATCGG CTACGTGCCG CAGACCGTGG AACTCGTCGA CGGCACCATC 
GGCGAGAACA TCGCGCGCTT CGATCCCGAT GCCACGTCGG ACGGCGTGAT CGCGGCCGCG 
CGCGCGGCGG GAATGCACGA GACGATCCTG GCCATGCCCG ACGGCTATGA CACGCGGCTG 
ACGGGGGGCG GGCTGGAACT CTCCGCCGGC CAGCGCCAGC GCGTGGGCCT TGCCAGGGCG 
CTTTACGGCG AACCGTTCCT TGTCGCGCTG GACGAGGCCA ATTCCAATCT CGACTCGGCG 
GGCGACGCAG CCCTGGCCAA GGCGGTCGAG GACGTCCGCA AGCGCGGCGG CATAGTTGTC 
ATGATTACCC ACCGCCCCGC TACGCTCGGG CCGATCAGCC ATGTCGCGGT CATGGCGGGT 
GGCCGCATCA TCGACCTTGG CGAGCGCGAC GAGGTGATGA AGCGGCTCAG CACCGCCAAC 
CCCGGCGAGC CGAAGGACGG CCAGACCGTT GCCGCCCGGA CAGGCCCGGC CAAGGTCGGT 
GCCAGCAAGA CCGGTTCCGA AGGGGAGGTT GCGCAATGA

Protein sequence

MGRDYLKLFV ARYRSSLVLV IAASVLLNLL VFAGTIYMML VYDSVLPSRS IPTLVGLFAM 
IVLVYLFQAL FEAIRGEAML SVANGVHDDL FAAVHHATVS RPLRAAADKG DGLQPIRDLD 
AIHTFLAGPG PTALIDLPWV IVFLFVLTAL HWWLGLTALV GVIVLSAIAL WSNRRTASAT 
RQLQSVIGQR SASAQAEIRN AETAVAMGMQ ERLLTRTRGW EADFLESQSR LSRLVSRFGG 
AGRTFRVFLQ SLILTVGALL VIDDKASGGV ILASSVLSGR ALAPVDSAIA NWRGLVAAST 
GWERIVQLIN AFQKAPPRSI ELGAPSAELS IRDLWVAPPG VQRMTVQGAA LSLTPGQALA 
IIGPSAAGKT SLMKAMLGIW RPQRGEVRLD GATLDQWAAE SLGRHIGYVP QTVELVDGTI 
GENIARFDPD ATSDGVIAAA RAAGMHETIL AMPDGYDTRL TGGGLELSAG QRQRVGLARA 
LYGEPFLVAL DEANSNLDSA GDAALAKAVE DVRKRGGIVV MITHRPATLG PISHVAVMAG 
GRIIDLGERD EVMKRLSTAN PGEPKDGQTV AARTGPAKVG ASKTGSEGEV AQ