Gene Saro_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1080
Symbol
ID	3916376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1124402
End bp	1125430
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	640443815
Product	Flp pilus assembly CpaB
Protein accession	YP_496359
Protein GI	87199102
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3745] Flp pilus assembly protein CpaB
TIGRFAM ID	[TIGR03177] Flp pilus assembly protein CpaB

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACAAGA GGAAGCTGAT GTTGCTGGTG GGGGCGCTGA TCGTAGCGAT CGGCACGGCC 
TTCGCAGCAA GGAGCCTTTT CGCCGGCAAT TCGACGCCCC AGGCTGAAGC CGCGGCCAAG 
GTGCCGACCG GCCCCAAGGT CCTCGTGGCG CAGCGCGCGC TTCCGGTCGG CACGATCATC 
ACAGCCGATT CAATCAACTT CCAGGCCTGG CCCAAGGACA TGGTGCAGGA CGCCTACTTC 
GTCGAAGGCG AGGCGGACAT GCAGAAGCTG CTCGGCACCG TCGTCCGCAA TCCGATCACG 
GCGGGCGAAC CGGTGACCAA GGGCAATCTT GTCGCCCCCG GCGACCGCGG CTTCCTCGCT 
GCTGCTCTCG GTGCCGGCAT GCGCGCCGTC ACCATCCCTG TTTCCGCACG CACCGGCGTT 
GCCGGCTTCG TCTTCCCGGG CGATCACATC GATCTCGTGC TGACCCAGAC TGTCAAGGGC 
ACGGGCGAAG GCATGGCGCT CAAGGCGTCG GAGACGATCC TCAAGAACCT GCGCGTCCTT 
GCCACCGACC AGTCGACCGA ACAGGAACAG GTCGAAGGCA AGACCCGCGT CCGCACCTTC 
AGCACCGTCA CACTCGAAGT GACGCCCAAG ATCGCCGAGA AGATTGCGGT CGCGCAGACC 
ATCGGTACGA TCAGCCTCTC GCTGCGCTCG CTGGCCGACA ACTCGGCCGA GCTGGAGCAG 
GCCATTGCCG CCGGCGACGT CAAGATCCCG GCAGGCGTGA CCAAGCAGCA GGAAGAGGCC 
CTGCTCCAGC AGGCGATGAA CCGCCCGCTG GGCGGCGGCA AGGACAGCTT CGTCACCGGC 
GGCGACGTCT CGCGCTTCCA GCGCAAGACC ATGCCCGTCA CGGCACCCGC AGCCGGCATG 
GGCGCCCCGC AGATGGCAGC CGCCACCGGC CCGCAAATGG CCTCCAACGC TGCCCCCGTT 
CGCCGCGGCC CGGTCGTCCG TGTGACCCGC GGCAAGGAAA CAGAATCCGT CTCGCTGGGA 
GGGAACTGA

Protein sequence

MDKRKLMLLV GALIVAIGTA FAARSLFAGN STPQAEAAAK VPTGPKVLVA QRALPVGTII 
TADSINFQAW PKDMVQDAYF VEGEADMQKL LGTVVRNPIT AGEPVTKGNL VAPGDRGFLA 
AALGAGMRAV TIPVSARTGV AGFVFPGDHI DLVLTQTVKG TGEGMALKAS ETILKNLRVL 
ATDQSTEQEQ VEGKTRVRTF STVTLEVTPK IAEKIAVAQT IGTISLSLRS LADNSAELEQ 
AIAAGDVKIP AGVTKQQEEA LLQQAMNRPL GGGKDSFVTG GDVSRFQRKT MPVTAPAAGM 
GAPQMAAATG PQMASNAAPV RRGPVVRVTR GKETESVSLG GN