Gene Saro_1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1075
Symbol
ID	3916371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1118771
End bp	1119778
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	64%
IMG OID	640443810
Product	type II secretion system protein
Protein accession	YP_496354
Protein GI	87199097
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2064] Flp pilus assembly protein TadC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.137371
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAGGA CTCCCCCCGG ACCGACGCTG CTCGGCTTCG ACGTCTACTT CGTCGGCTCG 
ATTCTCGTGG CCATCGCGGC TTTCGCGGTC ATGCTGGCAA TCTACGCCGC AGTCACCGTC 
CGCGATCCGA TGGCCAAACG TGTCAAGGCG CTGAACGAGC GGCGCGAACA GCTCAAGTCA 
GGCATCGTCA CCGCCAACGC CCGCAAGCGC ACGAGCATCG TCCGCCGCAA CCAGACGACC 
GACCAGATCC GCGGTTTCCT CGAATCGCTG AAAGTCCTGC AGGACAGTCA GCTCGCGGTC 
ATCCAGCAAA AGCTGGCGCA GGCCGGCATC CGCAAGAAGG AATGGGCGGT CGCCGTCATC 
CTCGGCCGAC TCGTCGGACC GATCGCGCTC GGCCTGTTCG GCGCGGCCGT GTTCTATTGG 
TCGAACACCT TCCCCGACTG GAGCCCGTTC AAGCGCTTCC TCGGCTTCGC GGTCTGCCTC 
ATCGCGGGCT ACAAGGGACC GGACCTCTTC ATCCAGAACC TCGTGTCCAA GCGCACGGTT 
GCTGTCCGCA AGGGCCTTCC CGATGCGCTC GACCTGCTGG TGATCTGCGC CGAGGCCGGT 
CTTACGGTCG ACGCCGCCTT CAGCCGCGTC GCCCGCGAAC TTGGCCGCGC CTATCCCGAA 
CTGGGCGACG AGTTTGCCCT GACTGCCATC GAACTGTCGT TCCTGACCGA GCGCAGGCAC 
GCCTTCGAAA ACCTTGCCTA CCGCGTCGAC CTGGACTCGG TGAAGGGCGT GGTCACGACG 
ATGATCCAGA CCGAACGCTA CGGCACGCCG CTGGCATCGG CCCTGCGCGT GCTGTCGGCG 
GAGTTCCGCA ACGAGCGAAT GATGCGCGCC GAGGAAAAGG CCGCGCGCCT TCCCGCAATC 
ATGACGATCC CGCTCATCCT TTTCATCCTG CCGGTGCTGT TCATCGTCAT TCTCGGCCCA 
GCCGCATGCT CGATCAGCGA CAGCCTCGTC AACAAGAAGC CGGTCTGA

Protein sequence

MTRTPPGPTL LGFDVYFVGS ILVAIAAFAV MLAIYAAVTV RDPMAKRVKA LNERREQLKS 
GIVTANARKR TSIVRRNQTT DQIRGFLESL KVLQDSQLAV IQQKLAQAGI RKKEWAVAVI 
LGRLVGPIAL GLFGAAVFYW SNTFPDWSPF KRFLGFAVCL IAGYKGPDLF IQNLVSKRTV 
AVRKGLPDAL DLLVICAEAG LTVDAAFSRV ARELGRAYPE LGDEFALTAI ELSFLTERRH 
AFENLAYRVD LDSVKGVVTT MIQTERYGTP LASALRVLSA EFRNERMMRA EEKAARLPAI 
MTIPLILFIL PVLFIVILGP AACSISDSLV NKKPV