Gene SNSL254_A0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0749
Symbol
ID	6484151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	757338
End bp	758477
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	57%
IMG OID	642736161
Product	citrate utilization protein B
Protein accession	YP_002039927
Protein GI	194443530
COG category
COG ID
TIGRFAM ID	[TIGR02484] CitB domain protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.762495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAGC TTGAAAAATT AATCATTGAG GCCACCGTGC TTACCGAACC GGAAGCCGAG 
GTCGAACGCG TCATGCAAGT GTGTAACGCG TGTCGCTACT GCGAAGGTTT TTGCGCGGTA 
TTTCCGGCGA TGACCCAGCG GCTCGAATTC GGTAAAGCCG ATATTCATTA TCTGGCGAAT 
TTATGTCATA ACTGCGGCGC CTGCCTGCAC GCGTGCCAGT ACGCGCCGCC CCATGAATTT 
GCCATTAACG TGCCGAAAGC GATGGCGCAA GCCCGCCTGG AGACGTATCA ACAGTATGCC 
CAGCCCGCGG CTTTTGGCGC GTTATACCGT CGGGCGGGGA TCACCGTCGC GCTGGCGCTG 
ATAATCGGTC TGACGCTCTT TTTATTACTG GCGATGGCGC TGAAAGGGTC GCTGATTCAT 
CCGCCGCTGG CCGGTGACTT CTATCAAATT TTTCCGCATA GCCTGCTGGC ATGGATGTTT 
GGCTCAGTTT TTGTGCTGGC AATCGGTTTG CTTATGGCGG GCGTAATCCG CTTCTGGCGT 
GAGATCTCGC CGGGTGTACC GCGTTCGGCG GAGATTGCGG AAGCGTCGCA CAATGCATTA 
ACGCTGAAAT ATCTCGACGG CGGTCACGGC AAAGGCTGTA ACGAAGCGGA CGATGCGTTC 
ACGCTGCTGC GCCGTCGCTT TCATCACTTT ACCTTTTACG GTTTTATGCT CTGTTTTGCC 
GCCACGGTCG TGGCGACAGG CTATCACTAC GTCACCGGTT GGGAAGCGCC CTACCCGTTC 
TTTAGCCTGC CGGTCATGCT CGGCACGTTG GGCGGTATCG GTCTGCTTAT CGGCCCGGCC 
GGGCTACTGT GGCTCAATCT GCGGCGGTCG CCGTTACATG GCGATGCGCG CCAGAAACCC 
ATGGATCGCG GCTTTATTCT GCTGCTGTTC TTAACCAGTC TGACCGGGCT GGCGCTGCTG 
GCAGGCAGAG ACACCAGCGG AATGGGCATA CTGCTGGCGC TCCATTTAGG CGTGGTGATG 
GCGCTCTTTC TCACCCTTCC CTACGGAAAA TTCGCCCACG GATTTTTCCG CTGCGCGGCC 
TTACTCAAAT GGGCAGTTGA GAAGCGACGC GGAAAACATG CGGGGGATAC AGGCAACTGA

Protein sequence

MKQLEKLIIE ATVLTEPEAE VERVMQVCNA CRYCEGFCAV FPAMTQRLEF GKADIHYLAN 
LCHNCGACLH ACQYAPPHEF AINVPKAMAQ ARLETYQQYA QPAAFGALYR RAGITVALAL 
IIGLTLFLLL AMALKGSLIH PPLAGDFYQI FPHSLLAWMF GSVFVLAIGL LMAGVIRFWR 
EISPGVPRSA EIAEASHNAL TLKYLDGGHG KGCNEADDAF TLLRRRFHHF TFYGFMLCFA 
ATVVATGYHY VTGWEAPYPF FSLPVMLGTL GGIGLLIGPA GLLWLNLRRS PLHGDARQKP 
MDRGFILLLF LTSLTGLALL AGRDTSGMGI LLALHLGVVM ALFLTLPYGK FAHGFFRCAA 
LLKWAVEKRR GKHAGDTGN