Gene SeD_A0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0189
Symbol
ID	6871331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	201644
End bp	202723
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	53%
IMG OID	642783436
Product	putative fimbrial protein precurosr
Protein accession	YP_002214130
Protein GI	198243284
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3539] P pilus assembly protein, pilin FimA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.558575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATT TATGGATGCT GCTGGCGCTG TCGCTATTTT CAGGCCATGC GCTGGCAGAC 
GGAACGATGG GCAACGGAAG CGGCTGGTGT CAACCCACCA GCGGCACGCA TAATTTCTTT 
TTTCCCCTTG ACCAGACCAT TACCGATACG GATGAGAACC AGGCAGGGAA AATAGTCAAA 
GAGAGTTGGT CGGTCGGCGG CGAATACAGC GCCAGGTGCG ACTGCGATAA TAAAGATTAT 
CAGGGCGTTA ACTATTTCAC CGCCACGACC GGCGATTTAA CACAAAAAGG AACGTACAGC 
GAAGCGGGTA GCAATGGGCA ACAGATGGAT TTTTATGTTC TGGTCGCGGG TAAGCTGGAG 
ATTGGTACGG AAACCTACAT CGTCGGTAAC CTGAAACAGT ATATCCCCGT TCCCTTTTCA 
GCGATCAGTA ATCAGGCCCC CACCGCAGGC GGGTGTACGG GCGCGGACAT AAACAAAATG 
TCCGCAGGGA ATAAGGGTAA CGTGCGTATT TATATTACTC ACCCACTGGT AGGTGAAATC 
ACCATTCCTG AGACGACGAT TATGAATCTC TATTTGTCAA AAACGCCGGG CAGCAGCGGA 
GATAATATTC CCCCTTCCGT TCCACCGATG GCGCACGTCA CCATGTCCGG GACCATTACC 
GTGCCGCAGT CCTGCTCCAT CAACGCCGGG CAGGTTATCG AGGTCAGGCT ACCGGATATT 
GAGGGCAAAG ATATTCGTCA CCTCGGCGAC AGTCCGCAGA ACTCGCACGT CACCACTCAG 
GTAAACTTTA CCTGTAGTAA CGTGGCGGAC GGCACCAACC TGTCGATGTC ATTAAATGGC 
GCAACCGATC CGCACAACCC GGACTACCTG AAAACTGACA ATGAGAATTT GGGGATACGG 
ATTTCCGATA AATACGATAA TACCATCGTT CCCGGCGGCA GCGCCGAATT GCCGATTGAA 
GATTACGCCG ACGGTAAAGG CAGCACCGAG TTCACCGCCG CGCCGGTCAA TACCACCGGA 
CATGTTCCCC ACACCGGAGA ATACCAGGCT ACCGCCACGC TGGAGATTCA GATTCGCTGA

Protein sequence

MKNLWMLLAL SLFSGHALAD GTMGNGSGWC QPTSGTHNFF FPLDQTITDT DENQAGKIVK 
ESWSVGGEYS ARCDCDNKDY QGVNYFTATT GDLTQKGTYS EAGSNGQQMD FYVLVAGKLE 
IGTETYIVGN LKQYIPVPFS AISNQAPTAG GCTGADINKM SAGNKGNVRI YITHPLVGEI 
TIPETTIMNL YLSKTPGSSG DNIPPSVPPM AHVTMSGTIT VPQSCSINAG QVIEVRLPDI 
EGKDIRHLGD SPQNSHVTTQ VNFTCSNVAD GTNLSMSLNG ATDPHNPDYL KTDNENLGIR 
ISDKYDNTIV PGGSAELPIE DYADGKGSTE FTAAPVNTTG HVPHTGEYQA TATLEIQIR