Gene SeD_A4158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4158
Symbol
ID	6873607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4004459
End bp	4005406
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	53%
IMG OID	642787095
Product	carboxylate/amino acid/amine transporter
Protein accession	YP_002217721
Protein GI	198244739
COG category	[R] General function prediction only
COG ID	[COG5006] Predicted permease, DMT superfamily
TIGRFAM ID	[TIGR00950] Carboxylate/Amino Acid/Amine Transporter

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.565076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.615657
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCTG CACGTAAAAA AATAAAACAA CATGACGAGG AAAAAATGGG TTCCACCAGA 
AAAGGGATGC TAAACGTCCT GATTGCCGCC GTATTGTGGG GGAGTTCAGG TGTTTGCGCG 
CAGTACATCA TGGAGCAAAG CCGTATGTCG TCACAGTTCC TGACGATGAT ACGTTTGTTA 
TTCGCCGGGC TGATACTGGT GACCTTCTCC TTTATGCACG GCGATAAGAT ATTTTCGATT 
CTTAAAAACC GCAAAGATGC CCTGAGTCTG CTGATTTTCT CCGTGGTGGG CGCGCTCACC 
GTTCAGCTAA CCTTCCTGCT TACGATTGAA AAATCCAATG CCGCCACCGC GACAGTGCTG 
CAATTTTTAT CGCCGACCAT TATTGTAGCG TGGTTTGCAT TAGCGCGAAG AACACGACCA 
GGCATTCTGG TCTTAACCGC CATTCTTACA TCGCTTATCG GCACCTTTTT ACTGGTGACT 
CACGGCAATC CAACATCGCT GTCGATCTCT TCAGGCGCGC TGTTCTGGGG TATCGCCTCC 
GCATTTGCCG CCGCCTTTTA TACGACCTGG CCTTCCAGGC TAATCGCCCA ATACGGCACG 
CTGCCAGTGG TCGGCTGGAG TATGTCCTTT GGCGGCCTTA TTCTGCTGCC CTTCTACGCT 
AAAGAAGGAA CGCACTTTGC GGTGAGCGGC AGCCTGATTC TGGCCTTTTT CTACCTTGTG 
GTGATCGGTA CGTCGCTGAC GTTCAGCCTG TATTTGAAAG GCGCGCAACT GATTGGTGGC 
CCCAAAGCCA GCATTTTAAG CTGCGCGGAA CCGTTAAGCA GCGCCCTGCT GTCGCTACTG 
CTGTTGGGGA TTAGTTTTAC CTTGCCGGAC TGGCTGGGCA CGCTGCTCAT TCTCTCGTCA 
GTGATTCTGA TCTCCCTCGA TTCCCGTCGA CGCGCGCGGG CCGCTTAA

Protein sequence

MMPARKKIKQ HDEEKMGSTR KGMLNVLIAA VLWGSSGVCA QYIMEQSRMS SQFLTMIRLL 
FAGLILVTFS FMHGDKIFSI LKNRKDALSL LIFSVVGALT VQLTFLLTIE KSNAATATVL 
QFLSPTIIVA WFALARRTRP GILVLTAILT SLIGTFLLVT HGNPTSLSIS SGALFWGIAS 
AFAAAFYTTW PSRLIAQYGT LPVVGWSMSF GGLILLPFYA KEGTHFAVSG SLILAFFYLV 
VIGTSLTFSL YLKGAQLIGG PKASILSCAE PLSSALLSLL LLGISFTLPD WLGTLLILSS 
VILISLDSRR RARAA