Gene PICST_29031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29031
Symbol	CTP1
ID	4851767
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2778041
End bp	2779209
Gene Length	1169 bp
Protein Length	294 aa
Translation table
GC content	42%
IMG OID	640393475
Product	citrate transport protein
Protein accession	XP_001387096
Protein GI	126275540
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0488853
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.528605
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCTC AAAAGGTATG TCCTACAGAG CTATTATGCT TTTGAAATTG ATAGAGAGAA 
GGGAAAGGGT CAAAAGTGAA TTAAAAGTGA AAAATTAAAG TGAAAATTGC TGAAGAATTC 
AAATTGAAAA ATTAGTCAAA GGTGAAAAAT TAAATTAGAG AGAGTGAATT CTTACAAGGG 
CACAACAGTG AAAGTTTTAA AAGTGTTAAT GTTCAACAGC CTTAGAACAA ATAAGATTGC 
TGTCTAATTC TATCAATTCT ATCAAAGCTT CTTGTAATGC TTTCTACTAA CTTCTTCAGA 
AAAAGGTTGA TCCTCTTAAG TCATTCATAG CTGGAGGTAC AGCTGGTGCT ATCGAGGGTG 
TCATCACCTA CCCCTTCGAG TTTGCCAAAA CAAGACTACA GTTGATCGAC AAATCAGCCA 
ACATATCTAG AAACCCATTG GTGTTGATCT TCAATGTGGC CAAGACTCAA GGCGTGGGCT 
CCCTTTACGT AGGATGTCCA GCCTTTGTAG TAGGAAACAC CGTCAAGGCT TCTGTTCGTT 
TTCTTGGGTT CGATTCCATC AAGGCGCTTT TGGCTGACAA GAACGGAAAG TTGTCTGGTC 
CTAGAGGTGT GATAGCCGGA CTCGGTGCTG GTTTGCTTGA GTCTGTGGTG GCGGTGACTC 
CTTTTGAAGC AATCAAAACA GCTTTGATTG ATGACAAACA ACTGGCTAAA CCAAAATACC 
AAAACGGACT TGTTTCAGGC ACATTAAAGC TTTGTAGAGA TCTTGGATTC AAGGGCATTT 
ATGCTGGTGT GGTACCAGTT TCGTTGAGGC AGGCTGCTAA CCAGGCTGTC AGATTGGGAT 
CTTACAATGC CATCAAGACT ATGATTCAAC AAGCCAGTGG CTCTCGTCCG GACCAGCCTT 
TAAGTTCAGT AGCTACCTTT GCTGTAGGTT CTTTTGCTGG AATTATCACT GTCTATACTA 
CCATGCCTAT CGATACCGTC AAGACCAGAA TGCAAGCCTT AGGTGCAGAT AAGCTCTACA 
CATCTACCGT CAACTGTTTC GCTAAGATCT TTAAGGAAGA AGGTCTCTTG ACGTTCTGGA 
AGGGAGCCAC TCCACGTTTG GGCAGATTGG TGTTGAGTGG TGGTATTGTT TTTACCATCT 
ACGAAAAGAT GTTGGTGATC ATGGGCTGA

Protein sequence

MSAQKKKVDP LKSFIAGGTA GAIEGVITYP FEFAKTRLQL IDKSANISRN PLVLIFNVAK 
TQGVGSLYVG CPAFVVGNTV KASVRFLGFD SIKALLADKN GKLSGPRGVI AGLGAGLLES 
VVAVTPFEAI KTALIDDKQL AKPKYQNGLV SGTLKLCRDL GFKGIYAGVV PVSLRQAANQ 
AVRLGSYNAI KTMIQQASGS RPDQPLSSVA TFAVGSFAGI ITVYTTMPID TVKTRMQALG 
ADKLYTSTVN CFAKIFKEEG LLTFWKGATP RLGRLVLSGG IVFTIYEKML VIMG