Gene Acid345_3056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3056
Symbol
ID	4071963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3631655
End bp	3632911
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	58%
IMG OID	637985075
Product	Na+ dependent nucleoside transporter
Protein accession	YP_592131
Protein GI	94970083
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCGCC TGACCGGTGT TCTCGGTCTG CTGGTTTTTC TGAGCCTGGC TTATCTCTTC 
TCGACCAACC GTCGCGCGAT CAAGTGGCGG ACGGTGATCA TCGGCCTTAT TCTCCAAATA 
CTGTTTGCGA TCTTTGTGCT GCGGGTGCCG ATCGGGCAAC GCATCATGCA AATAGGCGGC 
GACGGCGCTA AGAAGTTGCT GTCGTTCTCG TTCGCCGGAT CGAGCTTTGT GTTTGGTGAT 
CTTGGGGCGA GCGGCGGGAA GTACGGGTTC TTCTTTGCGT TCCAGGTGTT GCCGGTCATT 
ATTTTTATCG CGGCGTTCTT CGCGATCCTC TATCACTACG GAATTATGCA GTTCATCATT 
CGCAATGTTG CGAAGGTGAT GATGCGCTTT ATGGGCGCGA GCGGCGCCGA GTCGCTGAAT 
GTGGCTGCCA GCATTTTCAT GGGGCAAACG GAAGCGCCGC TGACGATCCG TCCGTTCCTG 
CCAAAACTGA CCCAGAGCGA ACTAATGGTG GTGATGACGA GCGGCATGGC GCATGTGTCT 
GGGGCGATCA TGGGCGCGTA CATCCTGCAG GGGATTGAGG CGAAGCACAT CCTCGCGGCG 
GTGATCATGA CGGCACCGGG AACATTCGTG ATCGCCAAGA TGCTGGTGCC GGAAACAGAG 
ACACCACTAA CCGCGGGACG CCTGGAGGCG ACGACCGAAG AGGAACTCAC AGGGGAAGAG 
AAGCACGCGA ACGTACTGGG CGCAGCGGCG AAGGGAACGA CCGACGGATT GTGGCTGGCG 
CTAAACGTGG GGGCGATGTT GATCTCGTTT CTCGCGCTGA TTGCGCTGAT CAACGGCGTT 
CTTGGCGGCA GCCACAACTG GCTGGCGGCG CACGGCTTCA AGTGGTTTCC CGACAAGTTG 
GAGACCATCA TCGGGGCGAT TTTTGCGCCG TTCGCGTGGC TGATTGGAAT TCCTTGGCGC 
GATTGCTTGA ACGTCGGGAA CCTGCTCGGC ACGCGCATGG TGCTGAATGA ACTGGTGGCT 
TTCACCATGC TTGGACAACA AAAGGCGGGA CTCGATCCGC GGTCGTTCAC GATTGCGACG 
TTCGCACTGT GCGGCTTCGC GAACTTGAGC TCGGTGGGTA TTCAGATCGG CGGATTGGGT 
GCGTTGGCCC CGAACCGCAG AAACGACCTT GCTAGATTGG GTTTTCGCGC GATGTTGGCC 
GGAACGATGG CGAACCTGAT GTCGGCGTCA ATTGTGGGGA TTCTGTTGCA TGCTTAA

Protein sequence

MERLTGVLGL LVFLSLAYLF STNRRAIKWR TVIIGLILQI LFAIFVLRVP IGQRIMQIGG 
DGAKKLLSFS FAGSSFVFGD LGASGGKYGF FFAFQVLPVI IFIAAFFAIL YHYGIMQFII 
RNVAKVMMRF MGASGAESLN VAASIFMGQT EAPLTIRPFL PKLTQSELMV VMTSGMAHVS 
GAIMGAYILQ GIEAKHILAA VIMTAPGTFV IAKMLVPETE TPLTAGRLEA TTEEELTGEE 
KHANVLGAAA KGTTDGLWLA LNVGAMLISF LALIALINGV LGGSHNWLAA HGFKWFPDKL 
ETIIGAIFAP FAWLIGIPWR DCLNVGNLLG TRMVLNELVA FTMLGQQKAG LDPRSFTIAT 
FALCGFANLS SVGIQIGGLG ALAPNRRNDL ARLGFRAMLA GTMANLMSAS IVGILLHA