Gene Saro_1521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1521
Symbol
ID	3917196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1565208
End bp	1566404
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	59%
IMG OID	640444262
Product	Flp pilus assembly protein ATPase CpaE-like
Protein accession	YP_496796
Protein GI	87199539
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4963] Flp pilus assembly protein, ATPase CpaE
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCC CTGGCGCTTC GGCCACGACC TCGCCCTTTG GCGGAAATGG TCCAGTTGTC 
GCAGTGTGTG CTTCGGCGAA GCAACTCGCC TTGCTCGAAC GGCAAGTAGA TGCTCTTGCT 
CGAATCCTGG TTGTTCCTTT CCCGCTCGGC TCCGCGGACG GGGTTGATCA GACTTCTGTC 
GCAAAGGCGT CGGTTTTTGT CCTCGAGGTC GATCCGGCCG ATAGGGCTTC GGTCGATCGC 
CTGATCCGGA TGCGCAAGGC GATGCCCGCA ACTGCGCTCA TTGCCGCCGT CGAAAACCCT 
GATCTTACCC TGACGCGCAC TCTCGTGCGC GAAGGGGTCA CTGACGTGAT TGCCTTGCCG 
TTTCGAGCCG ATGAACTTGT CAGCGCAACG CTCGATGCCA TGGCGCGGCA TGCGCAGGCG 
ATCGTTCCGG TGACGCTCGC GCCCGTGATT GGCGTGGTAC GCAGTTGCGG AGGATGCGGG 
GCTACGACGG TCGCCACGCA CCTTGCCCAT GCCCTCAATC AATTTAGCTG GACGAATGGT 
CCGGCTATCG TTGCGGACCT CGATCTCCAG TTCGGCGAAG TCGGCGCATA TCTTGACAGC 
AGTCGCAGTG GGTCGATCAC CGATCTCATG CTCGCGCATG ACAGGATTGA CCGCGAGTTC 
CTCTATTCCA TGGCGCCGCC TACCTCTGGC GGTGTCGGGG TGCTGTCTGC GCCAGCTACC 
ATCAACTCAA TCGAGTCCGT GAACGTCGAT GACATGCTCT TCGTCCTGGA CCAGCTGCGC 
CGGAATTACG GAGTAGTTGT CCTCGACTTT CCATCCGCAT GGAGCAACTG GGCTGCATCG 
TTGGCCGTTC TTTCCGACAT TCTATTGCTG GTGACGCCCG TTGCACTTTC CGGACTGCGG 
CAGACGAAAC GAACACTCGA CCTGTTTCGG ACATTGGAAA TTCCGGACGA AAAGGTGGCA 
ATCGTGGCCA ATCGCGTCGA GCGGAAACTT TTCCGCCTTG TTGGTACGAG CGAGGCTGAG 
GCGGCGATCG GCCGCAGTTT CGCCGCCTCG CTCTCGGATG AAGGCGATCA GATGGTTCGT 
GCGCAGGAGC AGGGCGTACT GATCCACAGC ATCCAGAAGA AGACCTCTTT CAGCACAGCG 
CTGATGAAGC TTGCGCAGTC GATACACGTT CAGTTGCATT CCGGACAGTT GCTATGA

Protein sequence

MSGPGASATT SPFGGNGPVV AVCASAKQLA LLERQVDALA RILVVPFPLG SADGVDQTSV 
AKASVFVLEV DPADRASVDR LIRMRKAMPA TALIAAVENP DLTLTRTLVR EGVTDVIALP 
FRADELVSAT LDAMARHAQA IVPVTLAPVI GVVRSCGGCG ATTVATHLAH ALNQFSWTNG 
PAIVADLDLQ FGEVGAYLDS SRSGSITDLM LAHDRIDREF LYSMAPPTSG GVGVLSAPAT 
INSIESVNVD DMLFVLDQLR RNYGVVVLDF PSAWSNWAAS LAVLSDILLL VTPVALSGLR 
QTKRTLDLFR TLEIPDEKVA IVANRVERKL FRLVGTSEAE AAIGRSFAAS LSDEGDQMVR 
AQEQGVLIHS IQKKTSFSTA LMKLAQSIHV QLHSGQLL