Gene P9303_21681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_21681
Symbol	alsT
ID	4777499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1923479
End bp	1924873
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	55%
IMG OID	640087678
Product	Sodium:alanine symporter family protein
Protein accession	YP_001018168
Protein GI	124023861
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1115] Na+/alanine symporter
TIGRFAM ID	[TIGR00835] amino acid carrier protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0888234
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGTGT TTCCAGCGTC GCTCTTGACG AATTTATCCT TACAACTCGG ACAGTTCCCA 
AGCGGACTGG AAGACGCAGT CGAGGCCATC AATAATCCGA TCAACGGCTT TGCCTGGGGT 
TGGCCCACAG TCATCCTGAT TGCAGGCACC GGCATCTTGC TGATGGTTGG GCTGGGCTTT 
ATGCCCTTAC TGCGCATCCC CTATGGCGTG CGCATGCTGC TTCGCAATCC AACCTCCTCT 
AGCGAGGGCG AAATCAGTCC ATTCCAGGCA CTGATGACCT CGATGGCGGC CACGATCGGC 
ACGGGCAACA TCGCCGGTGT CGCTGTTGCG ATCGCCATGG GCGGCCCTGG GGCGGTGTTC 
TGGATGTGGC TAATTGCCAT TTTTGGTATT GCCACCAAGT ACGCCGAAGC CTTACTTGCA 
GTTCACTTCC GCGAAGTGGA CCCCCTCGGC AATCATGTCG GTGGTCCGAT GTACTACATC 
CGCAATGGCC TAGGTCCAAA CTGGGCCTGG CTGGGCGGAT TCTTTGCCCT GTTTGGAATG 
CTGGCGGGCT TTGGCATTGG CAATGGCGTG CAATCGTTTG AGGTCTCCAG TGCCTTAGCC 
ACGATCGGCA TCCCTCGGCT TTTAACGGGT GTCGTGCTTG GAGTGCTTGT CTTTGGGGTC 
ATCATTGGCG GCATCAAACG CATCGCCCAG GCTGCATCCG CCATCGTTCC TTTGATGTCG 
TTGTTTTATG TGATTGCTTG CCTGGTCATC ATTCTCAGCA ACATCAGCGA AGTGCCAGCA 
GCGTTCTCAA CGATCTTCTC TAATGCCTTC ACAGGCGAAG CCGCTGCCAG CGGCACGTTG 
ACCCAAGTGA TCCTGATGGG CTTCAAGCGC GGCATCTTCT CCAATGAAGC TGGTCTCGGT 
AGTGCGCCAA TAGCTCACGC TGCCGCCAAC ACCAATGACC CAGTGCGTCA GGGCACTATC 
GCCATGCTTG GAACCTTCAT CGATACTTTG ATCATCTGCA CAATGACGGC TCTGGTGATC 
ATCACCACCG GTGCCTATCA GAGTGGTGAG TCAGGCTCTG ATCTATCAAT CGCTGCCTTC 
AACAGTGGCC TTGCAGGCTC AGGTTGGGTC GTGACAGCTG GCCTCGTGGT GTTTGCGCTA 
ACAACAGTTC TTGGCTGGGG CTTTTACAGC GAACGCTGCA CTGAATATCT CTTTGGGGTG 
CAAGCCATTC TCCCCTTCCG CCTGGTGTGG GTCGCTGTAG TTGTCATTGG TGCTGTTGCA 
GGCAATCGCG GCGTGGTGTG GGACGTAGCT GACACACTTA ATGGTCTGAT GGCGATTCCT 
AACTTGATCG CACTGGTGCT GCTCTCAGGC ACTGTCTTCC GCCTCTCCAA AAACTACCGA 
TTTGAAGAGG ACTAA

Protein sequence

MDVFPASLLT NLSLQLGQFP SGLEDAVEAI NNPINGFAWG WPTVILIAGT GILLMVGLGF 
MPLLRIPYGV RMLLRNPTSS SEGEISPFQA LMTSMAATIG TGNIAGVAVA IAMGGPGAVF 
WMWLIAIFGI ATKYAEALLA VHFREVDPLG NHVGGPMYYI RNGLGPNWAW LGGFFALFGM 
LAGFGIGNGV QSFEVSSALA TIGIPRLLTG VVLGVLVFGV IIGGIKRIAQ AASAIVPLMS 
LFYVIACLVI ILSNISEVPA AFSTIFSNAF TGEAAASGTL TQVILMGFKR GIFSNEAGLG 
SAPIAHAAAN TNDPVRQGTI AMLGTFIDTL IICTMTALVI ITTGAYQSGE SGSDLSIAAF 
NSGLAGSGWV VTAGLVVFAL TTVLGWGFYS ERCTEYLFGV QAILPFRLVW VAVVVIGAVA 
GNRGVVWDVA DTLNGLMAIP NLIALVLLSG TVFRLSKNYR FEED