Gene BCG9842_B5601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B5601
Symbol
ID	7183938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	5102734
End bp	5103945
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	38%
IMG OID	643553125
Product	nucleoside transporter, NupC family
Protein accession	YP_002448766
Protein GI	218900355
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000740053
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	6.13455e-18
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATCTTT TATGGGGAAT TGGCGGCGTG ATTGGAGTAT TAGCAATTGC TTTCTTACTA 
TCTTCCAACC GCAAAGCTAT TAATTGGCGC ACAATTTTAA TTGCGCTAGC ATTACAAATG 
TCATTTTCAT TTATCGTATT ACGATGGGAT GCTGGTAAAG CAGGTTTAAA ACACGCTGCT 
GACGGTGTTC AAGGATTAAT TAATTTTTCT TACGAGGGAA TTAAGTTCGT TGCTGGGGAT 
TTAGTCAACG CAAAAGGACC TTGGGGATTT GTATTCTTTA TTCAAGCACT ACTTCCAATC 
GTATTTATTA GTTCATTAGT AGCAATCTTA TATCATTTCG GTATTATGCA GAAATTTGTT 
AGCGTCGTTG GTGGTGCATT AAGTAAACTT CTTGGAACTT CTAAAGCAGA AAGCTTAAAC 
TCAGTAACGA CTGTATTTTT AGGACAAACT GAAGCTCCAA TCTTAATTAA ACCTTACTTA 
GCACGCTTAA CAAATAGTGA ATTCTTCACT ATTATGGTAA GCGGTATGAC AGCTGTTGCC 
GGATCAGTTC TTGTCGGCTA TGCAGCAATG GGTATTCCGT TAGAGCACTT ATTAGCAGCT 
GCAATTATGG CAGCTCCATC AAGCTTATTA ATTGCGAAAC TAATCATGCC AGAGACAGAA 
AAAGTAGATA ATAACGTTGA ACTTTCTACA GAACGTGAAG ACGCAAACGT TATCGACGCA 
GCTGCACGTG GTGCATCTGA AGGTATGCAA CTTGTTATTA ACGTAGCAGC AATGTTAATG 
GCTTTCATTG CATTAATCGC TTTATTAAAT GGTCTATTAG GATTAGTTGG GTCTTTATTC 
CATATTAAAC TTAGCCTTGA TTTAATCTTC GGTTACTTAT TATCACCATT TGCAATCTTA 
ATCGGGGTTT CTCCAGGTGA AGCTGTACAA GCAGCAAGCT TTATCGGTCA AAAACTTGCA 
ATCAACGAAT TCGTTGCATA CGCAAACTTA GGACCACATA TGGCAGAGTT CTCTGACAAA 
ACAAATCTAA TTTTAACATT CGCAATCTGT GGATTCGCAA ACTTCTCTTC TATTGCAATT 
CAATTAGGTG TAACAGGAAC GCTAGCTCCT ACTCGCCGTA AACAAATTGC ACAATTAGGG 
ATTAAAGCAG TTATCGCTGG TACATTAGCT AACTTCTTAA ATGCAGCAGT TGCAGGTATG 
ATGTTCCTAT AA

Protein sequence

MNLLWGIGGV IGVLAIAFLL SSNRKAINWR TILIALALQM SFSFIVLRWD AGKAGLKHAA 
DGVQGLINFS YEGIKFVAGD LVNAKGPWGF VFFIQALLPI VFISSLVAIL YHFGIMQKFV 
SVVGGALSKL LGTSKAESLN SVTTVFLGQT EAPILIKPYL ARLTNSEFFT IMVSGMTAVA 
GSVLVGYAAM GIPLEHLLAA AIMAAPSSLL IAKLIMPETE KVDNNVELST EREDANVIDA 
AARGASEGMQ LVINVAAMLM AFIALIALLN GLLGLVGSLF HIKLSLDLIF GYLLSPFAIL 
IGVSPGEAVQ AASFIGQKLA INEFVAYANL GPHMAEFSDK TNLILTFAIC GFANFSSIAI 
QLGVTGTLAP TRRKQIAQLG IKAVIAGTLA NFLNAAVAGM MFL