Gene Saro_1076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1076
Symbol
ID	3916372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1119798
End bp	1120772
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	63%
IMG OID	640443811
Product	type II secretion system protein
Protein accession	YP_496355
Protein GI	87199098
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4965] Flp pilus assembly protein TadB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.195162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGCA TTATCCAGCT TCTGCTGATG TCCACCGGGC TGATGGTGGC GATGGTGCTG 
GGCTATGCCG CGCTGTCCGG TCCATCGGCC TCGAAGGAAG TCAACCGGCG CCTCCAGTCG 
GTCCGCTTCC GTCACTCGGA AAGTACGCTG GACAAGGTCG AAGCGCAGTA TCGCAAGACG 
CTCGCCGCGC GCAAGCCGAA GACCATGAGG CCCGCCGGGT CTTCGTCGCG GCTCGAGGCG 
CTCGAACTGC GCCTGCACCG CACCGGCAAG GGCTGGACGC TTTCGCAGTA CCTCTACGTC 
AGCGGCGGCC TCGCCATTCT GATCTTCCTG CTGGTGTACC TGCGCACAGG CGCGCCTCTG 
CTGGCGCTCG GTTCCGGCAT TTTCATCGGC GGCGGCCTTC CCCACATGCT GGTCGGTCGT 
GCGATCAACA AGCGGATCGA CAACTTCGTC ACCCGCCTGC CCGATGCCCT GGACCTGCTG 
GTACGCGGCC TGCGCTCGGG CCTGCCCGTC ACCGAAACGC TCGGCGTCGT CGCGGCCGAA 
CTGCCGGGCC CGGTGGGCGA GGAGTTCAAG CTGGTGACCG ACCGCATCAA GGTGGGCCGC 
ACGATGGAAG AGGCTCTCCA GGACACGGCG GACCGGTTGA ACCTGCCGGA ATTCAACTTC 
TTCTGCATCA CGCTGGCGAT CCAGCGCGAG ACGGGCGGCA ACCTCGCGGA AACGCTGTCG 
AACCTGTCCG ACGTGCTGCG CAAGCGCGCA CAGATGAAGT TGAAGATCAA GGCGATGAGT 
TCGGAATCGA AAGCCTCGGC GTATATCGTC GGCGCCCTGC CCTTCATCGT CTTCGCCCTG 
ATCTACTGGA TCAACCCGGT CTATCTCGGA AAGTTCTTTG TGGACGAACG CCTCATCATC 
GCCGGCCTTG GCGGCCTGAC CTGGCTCGGT ATCGGAGCCT TCATCATGGC CAAGATGGTC 
AGCTTCGAAA TCTGA

Protein sequence

MTSIIQLLLM STGLMVAMVL GYAALSGPSA SKEVNRRLQS VRFRHSESTL DKVEAQYRKT 
LAARKPKTMR PAGSSSRLEA LELRLHRTGK GWTLSQYLYV SGGLAILIFL LVYLRTGAPL 
LALGSGIFIG GGLPHMLVGR AINKRIDNFV TRLPDALDLL VRGLRSGLPV TETLGVVAAE 
LPGPVGEEFK LVTDRIKVGR TMEEALQDTA DRLNLPEFNF FCITLAIQRE TGGNLAETLS 
NLSDVLRKRA QMKLKIKAMS SESKASAYIV GALPFIVFAL IYWINPVYLG KFFVDERLII 
AGLGGLTWLG IGAFIMAKMV SFEI