Gene Ent638_2937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2937
Symbol
ID	5111970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3188686
End bp	3189681
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	53%
IMG OID	640493131
Product	bile acid:sodium symporter
Protein accession	YP_001177652
Protein GI	146312578
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00230251
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.120648
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCT TTCGCATTCT CGATCCCTTT ACTCTTACCC TGATTGCCGT CGTGTTACTG 
GCCTCATTTT TCCCGGCCCG TGGCAGCTTC GTGCCTTTCG TTGAAGGTCT GACGACGGCA 
GCCATTGCCC TGCTGTTTTT TATGCACGGT GCCAAGCTCT CCCGCGAAGC CATCATTGCA 
GGCGGCAGCC ACTGGCGGCT GCATTTGTGG GTGATGTGCA GTACGTTCGT GATATTCCCG 
ATCCTTGGCG TGCTGTTCGC CTGGTGGGCA CCGGTGAATG TCGATCCCGC GCTTTACACT 
GGCTTCCTCT ATCTGTGTAT TTTGCCCGCG ACCGTGCAGT CAGCCATTGC CTTTACTTCT 
CTCGCGGGTG GCAATGTGGC GGCGGCAGTC TGTTCCGCAT CCGCCTCAAG TCTGTTAGGG 
ATTTTTGTTT CGCCACTGCT GGTCGGGTTG TTGATGAACA TGCATGGTGC GGAAGGCAAT 
CTGGAACAGG TGGGTAAAAT CTGCCTGCAG TTGCTGCTGC CATTTGTGCT GGGTCACCTT 
TCTCGCCCAT GGATTGGCGA TTTTGTGGCG AGAAATAAAA AGTGGATTGG GAAAACTGAC 
CAGACGTCGA TTTTGCTGGT GGTCTATTCC GCTTTTGGTG AAGCCGTCGT AAACGGTATC 
TGGCACAAAG TCGGCATCGG TTCGTTGCTG TTTATTGCGC TAGTGAGCTG CGTGCTGCTG 
GCGATAATTA TTGCGGTAAA CATGTTTGCC GCGCGTCGAT TCGGATTTAA TAAAGCCGAT 
GAAATCACCA TCGTCTTCTG CGGGTCGAAA AAGAGTCTGG CGAATGGCAT ACCGATGGCG 
AATATTCTGT TCCCGACGTC GGTCATTGGG ATGATGGTAC TGCCGCTAAT GATCTTCCAC 
CAAATCCAGC TGATGGTGTG CGCGGTGATG GCACGACGTT ACAAACGTCA AACCGAAAAG 
CTGGCGCAGG AAGAGTCCCA CGCCGCAAAA GCTTAA

Protein sequence

MKLFRILDPF TLTLIAVVLL ASFFPARGSF VPFVEGLTTA AIALLFFMHG AKLSREAIIA 
GGSHWRLHLW VMCSTFVIFP ILGVLFAWWA PVNVDPALYT GFLYLCILPA TVQSAIAFTS 
LAGGNVAAAV CSASASSLLG IFVSPLLVGL LMNMHGAEGN LEQVGKICLQ LLLPFVLGHL 
SRPWIGDFVA RNKKWIGKTD QTSILLVVYS AFGEAVVNGI WHKVGIGSLL FIALVSCVLL 
AIIIAVNMFA ARRFGFNKAD EITIVFCGSK KSLANGIPMA NILFPTSVIG MMVLPLMIFH 
QIQLMVCAVM ARRYKRQTEK LAQEESHAAK A